当前位置:网站首页>轻量型 GPU 应用首选 京东智联云推出 NVIDIA vGPU 实例
轻量型 GPU 应用首选 京东智联云推出 NVIDIA vGPU 实例
2020-11-06 22:06:00 【京东智联云开发者】
在使用异构计算服务的场景中,“计算资源过剩”问题十分普遍。以云游戏为例,企业通常仅需要一颗物理GPU几分之一的计算能力即可流畅完成图形或视觉计算。针对这类对算力需求较少的应用场景,轻量型异构计算产品则更为适用。
为了让用户可以用更细粒度的计算资源开启业务,京东智联云近期推出了基于NVDIA vGPU技术的虚拟化GPU实例,借助软件通过分片虚拟化技术将物理GPU卡重新划分,分割后的vGPU具有相应划分比例的计算能力和显存,同一块GPU卡经虚拟化分割后可分配至不同的云主机使用。用户在云上可以根据负载选择算力匹配的实例规格,满足多种异构计算场景,降低云上GPU使用成本。
京东智联云推出的vGPU云主机实例包含C类型(Virtual Compute Server)和Q类型(Quadro vDWS)两款,均**搭载NVIDIA Tesla P40,支持1/2、1/4、1/6 三种划分粒度**,并提供多种CPU、内存配置组合,用户可以按需选择适量的计算资源,提升系统灵活性,并大幅降低成本。
C类型vGPU实例主要面向AI、计算机学习和科学计算等场景,多适用于高校设计院、研究机构等深度学习的教学和实验场景;Q类型vGPU实例主要面向影视行业的实时渲染、图形图像处理和建筑工业设计等专业图像处理场景,可支持Maya、3DMAX、UG、BIM等专业级图形处理软件,满足用户对GPU在图形设计方面的需求。
▲C类型(Virtual Compute Server)vGPU实例规格▲
▲Q类型(Quadro vDWS)vGPU实例规格▲
在vGPU技术面世以前,云上GPU云主机大多采用直通模式(GPU passthrough),直通模式下GPU绕过操作系统,作为物理设备直接提供给虚拟机使用,由于没有设备的模拟和转换过程因此性能损失极小,能够满足多数大规模并行计算场景。
但是,直通模式下受限于GPU卡的物理使用限制,单台云主机至少搭载一块GPU,物理服务器GPU的数量又决定了云主机CPU和内存的分配比例,如业务在多数运行时间对GPU算力需求较少,会存在大量的计算资源浪费。因此,GPU核心平均使用率较低的轻量型GPU应用,非常适合选用vGPU规格主机来进行部署。
- 轻量型模型推理服务
深度学习场景下,在线推理所需的GPU资源往往少于离线训练,但是工作负载受线上业务影响会存在一定波动,高峰时期会有大量并发。此类业务部署时可以根据工作负载选择合适的vGPU规格主机作为集群的最小部署单元,以使得集群计算能力更贴合实际计算力需求曲线,提高GPU资源的使用率,优化成本。
- 教学、开发场景
高校及教学机构在开展AI相关课程时,需要提供搭载GPU的服务器作为基础教学实践环境,参与课程的人员研究方向和业务水平各异,对GPU资源算力的需求也不尽相同,在云上根据教学任务按需申请不同规格的vGPU云主机和GPU云主机,既能满足各种场景下的资源需求,又可以节省教学资源。
与物理GPU卡不同的是,NVIDIA vGPU面向不同的场景,提供四种类型产品。每种类型vGPU运行时需要相应的软件授权(License),对操作系统的要求也有所区别。
除此之外,不同类型的vGPU产品在诸多功能特性上也有所差异,详细说明可以前往**NVIDIA官网查阅(请戳链接** http://3.cn/15-k06ay)。
在授权方式上,vGPU云主机运行后会向预先配置的License Server服务器发起授权请求,成功获取License后会以标准性能运行,如获取License失败将会在性能受限的模式下运行直至获得授权。vGPU云主机只有在运行时才会消耗License,主机停止或释放时,License会被License Server自动回收。
推荐阅读:
欢迎点击【京东智联云】,了解开发者社区
更多精彩技术实践与独家干货解析
欢迎关注【京东智联云开发者】公众号
版权声明
本文为[京东智联云开发者]所创,转载请带上原文链接,感谢
https://my.oschina.net/u/4090830/blog/4700674
边栏推荐
- How to prepare for the system design interview
- 预留电池接口,内置充放电电路及电量计,迅为助力轻松搞定手持应用
- Basic usage of Vue codemirror: search function, code folding function, get editor value and verify in time
- ado.net和asp.net的关系
- A concise tutorial for Nacos, ribbon and feign
- Multi robot market share solution
- Zero basis to build a web search engine of its own
- 意外的元素..所需元素..
- Code generator plug-in and creator preform file analysis
- NAND FLASH的接口控制设计
猜你喜欢
git远程库回退指定版本
意外的元素..所需元素..
Basic usage of Vue codemirror: search function, code folding function, get editor value and verify in time
Why is the LS command stuck when there are too many files?
Digital city responds to relevant national policies and vigorously develops the construction of digital twin platform
Flink's datasource Trilogy 2: built in connector
Code generator plug-in and creator preform file analysis
Vue communication and cross component listening state Vue communication
ES中删除索引的mapping字段时应该考虑的点
jenkins安装部署过程简记
随机推荐
Multi robot market share solution
大会倒计时|2020 PostgreSQL亚洲大会-中文分论坛议程安排
What is the meaning of sector sealing of filecoin mining machine since the main network of filecoin was put online
Git rebase is in trouble. What to do? Waiting line
CCR coin frying robot: the boss of bitcoin digital currency, what you have to know
STM32F030K6T6兼容替换灵动MM32F031K6T6
ES中删除索引的mapping字段时应该考虑的点
Those who have worked in China for six years and a million annual salary want to share these four points with you
What kind of music do you need to make for a complete game?
Diamond standard
Code generator plug-in and creator preform file analysis
行为型模式之备忘录模式
STM32F030F4P6兼容灵动微MM32F031F4P6
Zero basis to build a web search engine of its own
Why is the LS command stuck when there are too many files?
How about small and medium-sized enterprises choose shared office?
Behind the record breaking Q2 revenue of Alibaba cloud, the cloud opening mode is reshaping
Road to simple HTML + JS to achieve the most simple game Tetris
Python 100 cases
Using iceberg on kubernetes to create a new generation of cloud original data Lake