当前位置:网站首页>轻量型 GPU 应用首选 京东智联云推出 NVIDIA vGPU 实例
轻量型 GPU 应用首选 京东智联云推出 NVIDIA vGPU 实例
2020-11-06 22:06:00 【京东智联云开发者】
在使用异构计算服务的场景中,“计算资源过剩”问题十分普遍。以云游戏为例,企业通常仅需要一颗物理GPU几分之一的计算能力即可流畅完成图形或视觉计算。针对这类对算力需求较少的应用场景,轻量型异构计算产品则更为适用。
为了让用户可以用更细粒度的计算资源开启业务,京东智联云近期推出了基于NVDIA vGPU技术的虚拟化GPU实例,借助软件通过分片虚拟化技术将物理GPU卡重新划分,分割后的vGPU具有相应划分比例的计算能力和显存,同一块GPU卡经虚拟化分割后可分配至不同的云主机使用。用户在云上可以根据负载选择算力匹配的实例规格,满足多种异构计算场景,降低云上GPU使用成本。


京东智联云推出的vGPU云主机实例包含C类型(Virtual Compute Server)和Q类型(Quadro vDWS)两款,均**搭载NVIDIA Tesla P40,支持1/2、1/4、1/6 三种划分粒度**,并提供多种CPU、内存配置组合,用户可以按需选择适量的计算资源,提升系统灵活性,并大幅降低成本。
C类型vGPU实例主要面向AI、计算机学习和科学计算等场景,多适用于高校设计院、研究机构等深度学习的教学和实验场景;Q类型vGPU实例主要面向影视行业的实时渲染、图形图像处理和建筑工业设计等专业图像处理场景,可支持Maya、3DMAX、UG、BIM等专业级图形处理软件,满足用户对GPU在图形设计方面的需求。

▲C类型(Virtual Compute Server)vGPU实例规格▲

▲Q类型(Quadro vDWS)vGPU实例规格▲

在vGPU技术面世以前,云上GPU云主机大多采用直通模式(GPU passthrough),直通模式下GPU绕过操作系统,作为物理设备直接提供给虚拟机使用,由于没有设备的模拟和转换过程因此性能损失极小,能够满足多数大规模并行计算场景。
但是,直通模式下受限于GPU卡的物理使用限制,单台云主机至少搭载一块GPU,物理服务器GPU的数量又决定了云主机CPU和内存的分配比例,如业务在多数运行时间对GPU算力需求较少,会存在大量的计算资源浪费。因此,GPU核心平均使用率较低的轻量型GPU应用,非常适合选用vGPU规格主机来进行部署。
- 轻量型模型推理服务
深度学习场景下,在线推理所需的GPU资源往往少于离线训练,但是工作负载受线上业务影响会存在一定波动,高峰时期会有大量并发。此类业务部署时可以根据工作负载选择合适的vGPU规格主机作为集群的最小部署单元,以使得集群计算能力更贴合实际计算力需求曲线,提高GPU资源的使用率,优化成本。
- 教学、开发场景
高校及教学机构在开展AI相关课程时,需要提供搭载GPU的服务器作为基础教学实践环境,参与课程的人员研究方向和业务水平各异,对GPU资源算力的需求也不尽相同,在云上根据教学任务按需申请不同规格的vGPU云主机和GPU云主机,既能满足各种场景下的资源需求,又可以节省教学资源。

与物理GPU卡不同的是,NVIDIA vGPU面向不同的场景,提供四种类型产品。每种类型vGPU运行时需要相应的软件授权(License),对操作系统的要求也有所区别。

除此之外,不同类型的vGPU产品在诸多功能特性上也有所差异,详细说明可以前往**NVIDIA官网查阅(请戳链接** http://3.cn/15-k06ay)。
在授权方式上,vGPU云主机运行后会向预先配置的License Server服务器发起授权请求,成功获取License后会以标准性能运行,如获取License失败将会在性能受限的模式下运行直至获得授权。vGPU云主机只有在运行时才会消耗License,主机停止或释放时,License会被License Server自动回收。
推荐阅读:
欢迎点击【京东智联云】,了解开发者社区
更多精彩技术实践与独家干货解析
欢迎关注【京东智联云开发者】公众号

版权声明
本文为[京东智联云开发者]所创,转载请带上原文链接,感谢
https://my.oschina.net/u/4090830/blog/4700674
边栏推荐
- 2020-09-09:裸写算法:两个线程轮流打印数字1-100。
- How to play sortable JS vuedraggable to realize nested drag function of forms
- CCR coin frying robot: the boss of bitcoin digital currency, what you have to know
- Visual rolling [contrast beauty]
- [elastic search engine]
- (2) ASP.NET Core3.1 Ocelot routing
- Python basic variable type -- list analysis
- An article will introduce you to CSS3 background knowledge
- Vue communication and cross component listening state Vue communication
- Flink's datasource Trilogy 2: built in connector
猜你喜欢

解决 WPF 绑定集合后数据变动界面却不更新的问题

Will blockchain be the antidote to the global epidemic accelerating the transformation of Internet enterprises?

git远程库回退指定版本

Those who have worked in China for six years and a million annual salary want to share these four points with you

Flink's datasource Trilogy 2: built in connector

An article takes you to understand CSS3 picture border

Kubernetes and OAM to build a unified, standardized application management platform knowledge! (Internet disk link attached)

ado.net和asp.net的关系

This project allows you to quickly learn about a programming language in a few minutes

ES6 learning notes (4): easy to understand the new grammar of ES6
随机推荐
How about small and medium-sized enterprises choose shared office?
Zero basis to build a web search engine of its own
GitHub: the foundation of the front end
2020-09-03:裸写算法:回形矩阵遍历。
谷歌浏览器实现视频播放加速功能
Elasticsearch database | elasticsearch-7.5.0 application construction
es创建新的索引库并拷贝旧的索引库 实践亲测有效!
Ronglian completed US $125 million f round financing
Summary of front-end interview questions (C, s, s) that front-end engineers need to understand (2)
行为型模式之备忘录模式
CloudQuery V1.2.0 版本发布
【学习】接口测试用例编写和测试关注点
Stickinengine architecture 12 communication protocol
2020-08-19:TCP是通过什么机制保障可靠性的?
2020-08-18:介绍下MR过程?
Top 5 Chinese cloud manufacturers in 2018: Alibaba cloud, Tencent cloud, AWS, telecom, Unicom
嘉宾专访|2020 PostgreSQL亚洲大会阿里云数据库专场:王涛
Bitcoin once exceeded 14000 US dollars and is about to face the test of the US election
大数据处理黑科技:揭秘PB级数仓GaussDB(DWS) 并行计算技术
2020-08-20:GO语言中的协程与Python中的协程的区别?
