当前位置:网站首页>2D 照片变身 3D 模型,来看英伟达的 AI 新“魔法”!
2D 照片变身 3D 模型,来看英伟达的 AI 新“魔法”!
2022-06-25 03:44:00 【AI科技大本营】

整理 | 郑丽媛
出品 | CSDN
在本周举办的计算机视觉和模式识别会议(CVPR)上,英伟达推出了一种名为 3D MoMa 的 AI “魔法”:将静态 2D 照片转换为可轻松编辑的 3D 模型。
据英伟达介绍,3D MoMa 可供建筑师、设计师、艺术家和游戏开发者将图像转换的 3D 模型快速导入图形引擎,使用过程中还可以修改比例、更改材料或尝试不同的照明效果。

从 2D 图像中提取 3D 模型
现实中,如想让使艺术家或工程师能充分利用 3D 模型,将其放入游戏引擎、3D 建模器或电影渲染器等广泛使用的工具中最好不过,不过前提是:这类 3D 模型是带有纹理材料的三角网格形式(主要用于定义 3D 图形和建模形状的基本框架)。
一般来说,许多游戏工作室和创作者习惯性会使用复杂的摄影测量技术来创建此类 3D 模型,不仅要劳心劳力地手动操作,还需耗费大量时间——但 3D MoMa 的出现或将改变这一局面。
据了解,3D MoMa 的背后,是被英伟达图形研究副总裁 David Luebke 称之为“统一计算机视觉和计算机图形的圣杯”的逆向渲染技术。
逆向渲染,即将一系列静态 2D 照片重建成物体或场景的 3D 模型的技术,而 3D MoMa 则是通过将每一个逆向渲染问题都定义为 GPU 加速的可微分组件,使用现代 AI 机器和英伟达 GPU 的原始计算能力来快速生成 3D 对象,使创造者可以在现有工具中不受限制地对其导入、编辑和扩展。
英伟达官博介绍道,3D MoMa 能在单个 Tensor Core GPU 上,1 小时内就生成三角网格模型,输出结果将直接与创作者正在使用的 3D 图形引擎和建模工具兼容。

不仅如此,因为 3D MoMa 生成的是三角网格模型,而网格就像是由三角形构建的 3D 形状纸质模型,因此创作者可以对其进行重建:改变其网格模型、材质和照明效果。

虚拟 3D 乐器大秀爵士乐表演
为了更直观地展示 3D MoMa 的功能,英伟达研究团队首先从不同角度收集了五种爵士乐队乐器(小号、长号、萨克斯管、架子鼓和单簧管)的近 100 张图像。
然后,研究团队利用 3D MoMa 将这些 2D 图像转换为每个乐器的三角网格模型,将其从原始场景中取出并导入 Omniverse 3D 模拟平台进行编辑。

正如上文所说,创作者可以对 3D MoMa 的输出结果重建,因此英伟达研究团队也进行了尝试。
可改变材质,把小号原来的塑料材质转换为黄金、大理石、木材或软木;
可将新编辑的模型放入虚拟场景,将这些乐器放入了经典的图形渲染质量测试康奈尔盒(Cornell Box)中,发现虚拟乐器在里面对光线的反映与现实世界中一样;
这些通过逆向渲染生成的新模型可用作复杂动画场景的构成要素,如下面这个视频所示。
虽然目前的 3D MoMa 仍在开发中,但英伟达对此充满期待:相信它可以让游戏开发这和其他设计师快速修改 3D 对象,然后将它们添加到任何虚拟场景中。
参考链接:
https://blogs.nvidia.com/blog/2022/06/21/inverse-rendering-3d-research-cvpr/
https://thenextweb.com/news/nvidias-new-ai-magic-turns-2d-photos-into-3d-graphics

往期回顾
分享
点收藏
点点赞
点在看边栏推荐
- Jilin University 22 spring March "career design" assignment assessment-00072
- Maintenant, les oreilles vont entrer dans le métacosme.
- Work assessment of Biopharmaceutics of Jilin University in March of the 22nd spring -00031
- 谷歌创始人布林二婚破裂:被曝1月已提出与华裔妻子离婚,目前身家6314亿美元...
- Peking University has a new president! Gongqihuang, academician of the Chinese Academy of Sciences, took over and was admitted to the Physics Department of Peking University at the age of 15
- Time management understood after working at home | community essay solicitation
- Oracle-sqlload import external data details
- Tutorial on installing SSL certificates in Microsoft Exchange Server 2007
- Apple's legendary design team disbanded after jobs refused to obey cook
- Svn deployment
猜你喜欢

谷歌创始人布林二婚破裂:被曝1月已提出与华裔妻子离婚,目前身家6314亿美元...

Redis related-03

IE寿终正寝,网友们搞起了真·墓碑……

Randla net: efficient semantic segmentation of large scale point clouds

opencv是开源的吗?

Russian Airi Research Institute, etc. | SEMA: prediction of antigen B cell conformation characterization using deep transfer learning

How far is the memory computing integrated chip from popularization? Listen to what practitioners say | collision school x post friction intelligence

MySQL modifies and deletes tables in batches according to the table prefix

MySQL根据表前缀批量修改、删除表

(超详细onenet TCP协议接入)arduino+esp8266-01s接入物联网平台,上传实时采集数据/TCP透传(以及lua脚本如何获取和编写
随机推荐
Two common OEE monitoring methods for equipment utilization
论一个优秀红队人员的自我修养
How far is the memory computing integrated chip from popularization? Listen to what practitioners say | collision school x post friction intelligence
[team learning] SQL programming language notes - task04
Background page production 01 production of IVX low code sign in system
OpenSUSE environment variable settings
騰訊開源項目「應龍」成Apache頂級項目:前身長期服務微信支付,能hold住百萬億級數據流處理...
如何使用IDE自动签名调试鸿蒙应用
How to play well in the PMP Exam?
Sorting of poor cattle (winter vacation daily question 40)
Self cultivation and learning encouragement
Maybe it's the wrong reason
opencv 红色区域在哪里?
Now, the ear is going into the metauniverse
ASP. Net conference room booking applet source code booking applet source code
Copilot免费时代结束!正式版67元/月,学生党和热门开源项目维护者可白嫖
Tianshu night reading notes - 8.4 diskperf disassembly
Install ffmpeg in LNMP environment and use it in yii2
站在风暴中心:如何给飞奔中的腾讯更换引擎
Huawei failed to appeal and was prohibited from selling 5g equipment in Sweden; Apple regained the first place in the world in terms of market value; DeNO completes round a financing of USD 21million