当前位置:网站首页>轻量型 GPU 应用首选 京东智联云推出 NVIDIA vGPU 实例
轻量型 GPU 应用首选 京东智联云推出 NVIDIA vGPU 实例
2020-11-06 22:06:00 【京东智联云开发者】
在使用异构计算服务的场景中,“计算资源过剩”问题十分普遍。以云游戏为例,企业通常仅需要一颗物理GPU几分之一的计算能力即可流畅完成图形或视觉计算。针对这类对算力需求较少的应用场景,轻量型异构计算产品则更为适用。
为了让用户可以用更细粒度的计算资源开启业务,京东智联云近期推出了基于NVDIA vGPU技术的虚拟化GPU实例,借助软件通过分片虚拟化技术将物理GPU卡重新划分,分割后的vGPU具有相应划分比例的计算能力和显存,同一块GPU卡经虚拟化分割后可分配至不同的云主机使用。用户在云上可以根据负载选择算力匹配的实例规格,满足多种异构计算场景,降低云上GPU使用成本。
京东智联云推出的vGPU云主机实例包含C类型(Virtual Compute Server)和Q类型(Quadro vDWS)两款,均**搭载NVIDIA Tesla P40,支持1/2、1/4、1/6 三种划分粒度**,并提供多种CPU、内存配置组合,用户可以按需选择适量的计算资源,提升系统灵活性,并大幅降低成本。
C类型vGPU实例主要面向AI、计算机学习和科学计算等场景,多适用于高校设计院、研究机构等深度学习的教学和实验场景;Q类型vGPU实例主要面向影视行业的实时渲染、图形图像处理和建筑工业设计等专业图像处理场景,可支持Maya、3DMAX、UG、BIM等专业级图形处理软件,满足用户对GPU在图形设计方面的需求。
▲C类型(Virtual Compute Server)vGPU实例规格▲
▲Q类型(Quadro vDWS)vGPU实例规格▲
在vGPU技术面世以前,云上GPU云主机大多采用直通模式(GPU passthrough),直通模式下GPU绕过操作系统,作为物理设备直接提供给虚拟机使用,由于没有设备的模拟和转换过程因此性能损失极小,能够满足多数大规模并行计算场景。
但是,直通模式下受限于GPU卡的物理使用限制,单台云主机至少搭载一块GPU,物理服务器GPU的数量又决定了云主机CPU和内存的分配比例,如业务在多数运行时间对GPU算力需求较少,会存在大量的计算资源浪费。因此,GPU核心平均使用率较低的轻量型GPU应用,非常适合选用vGPU规格主机来进行部署。
- 轻量型模型推理服务
深度学习场景下,在线推理所需的GPU资源往往少于离线训练,但是工作负载受线上业务影响会存在一定波动,高峰时期会有大量并发。此类业务部署时可以根据工作负载选择合适的vGPU规格主机作为集群的最小部署单元,以使得集群计算能力更贴合实际计算力需求曲线,提高GPU资源的使用率,优化成本。
- 教学、开发场景
高校及教学机构在开展AI相关课程时,需要提供搭载GPU的服务器作为基础教学实践环境,参与课程的人员研究方向和业务水平各异,对GPU资源算力的需求也不尽相同,在云上根据教学任务按需申请不同规格的vGPU云主机和GPU云主机,既能满足各种场景下的资源需求,又可以节省教学资源。
与物理GPU卡不同的是,NVIDIA vGPU面向不同的场景,提供四种类型产品。每种类型vGPU运行时需要相应的软件授权(License),对操作系统的要求也有所区别。
除此之外,不同类型的vGPU产品在诸多功能特性上也有所差异,详细说明可以前往**NVIDIA官网查阅(请戳链接** http://3.cn/15-k06ay)。
在授权方式上,vGPU云主机运行后会向预先配置的License Server服务器发起授权请求,成功获取License后会以标准性能运行,如获取License失败将会在性能受限的模式下运行直至获得授权。vGPU云主机只有在运行时才会消耗License,主机停止或释放时,License会被License Server自动回收。
推荐阅读:
欢迎点击【京东智联云】,了解开发者社区
更多精彩技术实践与独家干货解析
欢迎关注【京东智联云开发者】公众号
版权声明
本文为[京东智联云开发者]所创,转载请带上原文链接,感谢
https://my.oschina.net/u/4090830/blog/4700674
边栏推荐
- How about small and medium-sized enterprises choose shared office?
- How much disk space does a new empty file take?
- 【学习】接口测试用例编写和测试关注点
- An article will take you to understand CSS alignment
- A small goal in 2019 to become a blog expert of CSDN
- The role of theme music in games
- Stickinengine architecture 12 communication protocol
- ES6 learning notes (3): teach you to use js object-oriented thinking to realize the function of adding, deleting, modifying and checking tab column
- Open source a set of minimalist front and rear end separation project scaffold
- 2020-08-29:进程线程的区别,除了包含关系之外的一些区别,底层详细信息?
猜你喜欢
Python basic variable type -- list analysis
Share with Lianyun: is IPFs / filecoin worth investing in?
Introduction to the development of small game cloud
意派Epub360丨你想要的H5模板都在这里,电子书、大转盘、红包雨、问卷调查……
2020-08-18:介绍下MR过程?
2020-09-09:裸写算法:两个线程轮流打印数字1-100。
ES6 learning notes (4): easy to understand the new grammar of ES6
Understanding formatting principles
How about small and medium-sized enterprises choose shared office?
An article will introduce you to HTML tables and their main attributes
随机推荐
行为型模式之解释器模式
Zero basis to build a web search engine of its own
Top 5 Chinese cloud manufacturers in 2018: Alibaba cloud, Tencent cloud, AWS, telecom, Unicom
Code generator plug-in and creator preform file analysis
C language I blog assignment 03
Kubernetes and OAM to build a unified, standardized application management platform knowledge! (Internet disk link attached)
Diamond standard
Summary of front-end interview questions (C, s, s) that front-end engineers need to understand (2)
Visual rolling [contrast beauty]
ES6 learning notes (5): easy to understand ES6's built-in extension objects
Why is the LS command stuck when there are too many files?
MongoDB与SQL常用语法对应表
细数软件工程----各阶段必不可少的那些图
NAND FLASH的接口控制设计
What the hell is fastthreadlocal? The existence of ThreadLocal!!
ES中删除索引的mapping字段时应该考虑的点
【涂鸦物联网足迹】物联网基础介绍篇
Python basic variable type -- list analysis
What is the meaning of sector sealing of filecoin mining machine since the main network of filecoin was put online
The legality of IPFs / filecoin: protecting personal privacy from disclosure