当前位置:网站首页>轻量型 GPU 应用首选 京东智联云推出 NVIDIA vGPU 实例
轻量型 GPU 应用首选 京东智联云推出 NVIDIA vGPU 实例
2020-11-06 22:06:00 【京东智联云开发者】
在使用异构计算服务的场景中,“计算资源过剩”问题十分普遍。以云游戏为例,企业通常仅需要一颗物理GPU几分之一的计算能力即可流畅完成图形或视觉计算。针对这类对算力需求较少的应用场景,轻量型异构计算产品则更为适用。
为了让用户可以用更细粒度的计算资源开启业务,京东智联云近期推出了基于NVDIA vGPU技术的虚拟化GPU实例,借助软件通过分片虚拟化技术将物理GPU卡重新划分,分割后的vGPU具有相应划分比例的计算能力和显存,同一块GPU卡经虚拟化分割后可分配至不同的云主机使用。用户在云上可以根据负载选择算力匹配的实例规格,满足多种异构计算场景,降低云上GPU使用成本。
京东智联云推出的vGPU云主机实例包含C类型(Virtual Compute Server)和Q类型(Quadro vDWS)两款,均**搭载NVIDIA Tesla P40,支持1/2、1/4、1/6 三种划分粒度**,并提供多种CPU、内存配置组合,用户可以按需选择适量的计算资源,提升系统灵活性,并大幅降低成本。
C类型vGPU实例主要面向AI、计算机学习和科学计算等场景,多适用于高校设计院、研究机构等深度学习的教学和实验场景;Q类型vGPU实例主要面向影视行业的实时渲染、图形图像处理和建筑工业设计等专业图像处理场景,可支持Maya、3DMAX、UG、BIM等专业级图形处理软件,满足用户对GPU在图形设计方面的需求。
▲C类型(Virtual Compute Server)vGPU实例规格▲
▲Q类型(Quadro vDWS)vGPU实例规格▲
在vGPU技术面世以前,云上GPU云主机大多采用直通模式(GPU passthrough),直通模式下GPU绕过操作系统,作为物理设备直接提供给虚拟机使用,由于没有设备的模拟和转换过程因此性能损失极小,能够满足多数大规模并行计算场景。
但是,直通模式下受限于GPU卡的物理使用限制,单台云主机至少搭载一块GPU,物理服务器GPU的数量又决定了云主机CPU和内存的分配比例,如业务在多数运行时间对GPU算力需求较少,会存在大量的计算资源浪费。因此,GPU核心平均使用率较低的轻量型GPU应用,非常适合选用vGPU规格主机来进行部署。
- 轻量型模型推理服务
深度学习场景下,在线推理所需的GPU资源往往少于离线训练,但是工作负载受线上业务影响会存在一定波动,高峰时期会有大量并发。此类业务部署时可以根据工作负载选择合适的vGPU规格主机作为集群的最小部署单元,以使得集群计算能力更贴合实际计算力需求曲线,提高GPU资源的使用率,优化成本。
- 教学、开发场景
高校及教学机构在开展AI相关课程时,需要提供搭载GPU的服务器作为基础教学实践环境,参与课程的人员研究方向和业务水平各异,对GPU资源算力的需求也不尽相同,在云上根据教学任务按需申请不同规格的vGPU云主机和GPU云主机,既能满足各种场景下的资源需求,又可以节省教学资源。
与物理GPU卡不同的是,NVIDIA vGPU面向不同的场景,提供四种类型产品。每种类型vGPU运行时需要相应的软件授权(License),对操作系统的要求也有所区别。
除此之外,不同类型的vGPU产品在诸多功能特性上也有所差异,详细说明可以前往**NVIDIA官网查阅(请戳链接** http://3.cn/15-k06ay)。
在授权方式上,vGPU云主机运行后会向预先配置的License Server服务器发起授权请求,成功获取License后会以标准性能运行,如获取License失败将会在性能受限的模式下运行直至获得授权。vGPU云主机只有在运行时才会消耗License,主机停止或释放时,License会被License Server自动回收。
推荐阅读:
欢迎点击【京东智联云】,了解开发者社区
更多精彩技术实践与独家干货解析
欢迎关注【京东智联云开发者】公众号
版权声明
本文为[京东智联云开发者]所创,转载请带上原文链接,感谢
https://my.oschina.net/u/4090830/blog/4700674
边栏推荐
- Building a new generation cloud native data lake with iceberg on kubernetes
- 打工人好物——磨炼钢铁意志就要这样高效的电脑
- Junit测试出现 empty test suite
- C language I blog assignment 03
- PHP application docking justswap special development kit【 JustSwap.PHP ]
- Vue communication and cross component listening state Vue communication
- 行为型模式之备忘录模式
- ES6 learning notes (5): easy to understand ES6's built-in extension objects
- Kubernetes and OAM to build a unified, standardized application management platform knowledge! (Internet disk link attached)
- Python basic data type -- tuple analysis
猜你喜欢
Elasticsearch database | elasticsearch-7.5.0 application construction
2020-08-24:什么是小文件?很多小文件会有什么问题?很多小文件怎么解决?(大数据)
Stickinengine architecture 11 message queue
C and C / C + + mixed programming series 5 - GC collaboration of memory management
What are the highlights of Huawei mate 40 series with HMS?
Git rebase is in trouble. What to do? Waiting line
ES中删除索引的mapping字段时应该考虑的点
非易失性MRAM存储器应用于各级高速缓存
嘉宾专访|2020 PostgreSQL亚洲大会阿里云数据库专场:曾文旌
美团内部讲座|周烜:华东师范大学的数据库系统研究
随机推荐
jenkins安装部署过程简记
Markdown tricks
CCR coin frying robot: the boss of bitcoin digital currency, what you have to know
How much disk space does a file of 1 byte actually occupy
大数据处理黑科技:揭秘PB级数仓GaussDB(DWS) 并行计算技术
Road to simple HTML + JS to achieve the most simple game Tetris
File download manager realized by electron
Multi robot market share solution
Why is the LS command stuck when there are too many files?
Unity performance optimization
ERD-ONLINE 免费在线数据库建模工具
Novice guidance and event management system in game development
打工人好物——磨炼钢铁意志就要这样高效的电脑
2020-08-24:什么是小文件?很多小文件会有什么问题?很多小文件怎么解决?(大数据)
Swagger 3.0 brushes the screen every day. Does it really smell good?
Flink's datasource Trilogy: direct API
Metersphere developer's Manual
C and C / C + + mixed programming series 5 - GC collaboration of memory management
ES中删除索引的mapping字段时应该考虑的点
What the hell is fastthreadlocal? The existence of ThreadLocal!!