当前位置:网站首页>2D 照片变身 3D 模型,来看英伟达的 AI 新“魔法”!
2D 照片变身 3D 模型,来看英伟达的 AI 新“魔法”!
2022-06-24 09:52:00 【CSDN资讯】

整理 | 郑丽媛
出品 | CSDN(ID:CSDNnews)
在本周举办的计算机视觉和模式识别会议(CVPR)上,英伟达推出了一种名为 3D MoMa 的 AI “魔法”:将静态 2D 照片转换为可轻松编辑的 3D 模型。
据英伟达介绍,3D MoMa 可供建筑师、设计师、艺术家和游戏开发者将图像转换的 3D 模型快速导入图形引擎,使用过程中还可以修改比例、更改材料或尝试不同的照明效果。

从 2D 图像中提取 3D 模型
现实中,如想让使艺术家或工程师能充分利用 3D 模型,将其放入游戏引擎、3D 建模器或电影渲染器等广泛使用的工具中最好不过,不过前提是:这类 3D 模型是带有纹理材料的三角网格形式(主要用于定义 3D 图形和建模形状的基本框架)。
一般来说,许多游戏工作室和创作者习惯性会使用复杂的摄影测量技术来创建此类 3D 模型,不仅要劳心劳力地手动操作,还需耗费大量时间——但 3D MoMa 的出现或将改变这一局面。
据了解,3D MoMa 的背后,是被英伟达图形研究副总裁 David Luebke 称之为“统一计算机视觉和计算机图形的圣杯”的逆向渲染技术。
逆向渲染,即将一系列静态 2D 照片重建成物体或场景的 3D 模型的技术,而 3D MoMa 则是通过将每一个逆向渲染问题都定义为 GPU 加速的可微分组件,使用现代 AI 机器和英伟达 GPU 的原始计算能力来快速生成 3D 对象,使创造者可以在现有工具中不受限制地对其导入、编辑和扩展。
英伟达官博介绍道,3D MoMa 能在单个 Tensor Core GPU 上,1 小时内就生成三角网格模型,输出结果将直接与创作者正在使用的 3D 图形引擎和建模工具兼容。

不仅如此,因为 3D MoMa 生成的是三角网格模型,而网格就像是由三角形构建的 3D 形状纸质模型,因此创作者可以对其进行重建:改变其网格模型、材质和照明效果。

虚拟 3D 乐器大秀爵士乐表演
为了更直观地展示 3D MoMa 的功能,英伟达研究团队首先从不同角度收集了五种爵士乐队乐器(小号、长号、萨克斯管、架子鼓和单簧管)的近 100 张图像。
然后,研究团队利用 3D MoMa 将这些 2D 图像转换为每个乐器的三角网格模型,将其从原始场景中取出并导入 Omniverse 3D 模拟平台进行编辑。

正如上文所说,创作者可以对 3D MoMa 的输出结果重建,因此英伟达研究团队也进行了尝试。
可改变材质,把小号原来的塑料材质转换为黄金、大理石、木材或软木;
可将新编辑的模型放入虚拟场景,将这些乐器放入了经典的图形渲染质量测试康奈尔盒(Cornell Box)中,发现虚拟乐器在里面对光线的反映与现实世界中一样;
这些通过逆向渲染生成的新模型可用作复杂动画场景的构成要素,如下面这个视频所示。
虽然目前的 3D MoMa 仍在开发中,但英伟达对此充满期待:相信它可以让游戏开发这和其他设计师快速修改 3D 对象,然后将它们添加到任何虚拟场景中。
参考链接:
https://blogs.nvidia.com/blog/2022/06/21/inverse-rendering-3d-research-cvpr/
https://thenextweb.com/news/nvidias-new-ai-magic-turns-2d-photos-into-3d-graphics
— 推荐阅读 —
《新程序员001-004》已全面上市
欢迎扫描下方二维码或点击进入立即订阅
即可畅享电子书及精美纸质书。
*AI 帮写代码 67 元/月!GitHub Copilot 搞收费“双标”,劝退大批程序员
*把腾讯搬到云上,治愈了他们的技术焦虑
*M2 芯片解析:似乎是一个增强版的 A15?一键三连 「分享」「点赞」「在看」
成就一亿技术人
边栏推荐
- [technical tutorial] national standard protocol platform easygbs cascading supports customized national standard channels
- js中对象合并的4种方式,对象合并的4种方法
- Charles packet capturing tool tutorial
- Four methods of object merging and four methods of object merging in JS
- Smart energy: scenario application of intelligent security monitoring technology easycvr in the petroleum energy industry
- Today's sleep quality record 76 points
- [JS reverse sharing] community information of a website
- PPT绘图相关,快捷键,美观度
- "One good programmer is worth five ordinary programmers!"
- Pycharm shortcut keys
猜你喜欢

把腾讯搬到云上,治愈了他们的技术焦虑

MYSQL_精讲数据库数据类型
![[JS reverse sharing] community information of a website](/img/71/8b77c6d229b1a8301a55dada08b74f.png)
[JS reverse sharing] community information of a website

Thread operation principle

历史上的今天:图灵诞生日;互联网奠基人出生;Reddit 上线

【IEEE出版】2022年自然语言处理与信息检索国际会议(ECNLPIR 2022)

今日睡眠质量记录76分
![[activities this Saturday] NET Day in China](/img/33/c0e8eeb8f673232a7c27bbaf5e713f.jpg)
[activities this Saturday] NET Day in China

Rising bubble canvas breaking animation JS special effect

Canvas falling ball gravity JS special effect animation
随机推荐
What is a compressed file? What are the advantages of different methods of compressing files?
Any 与 TypeVar,让 IDE 的自动补全更好用
脚本之美│VBS 入门交互实战
How to use arbitrarygen code generator what are the characteristics of this generator
历史上的今天:图灵诞生日;互联网奠基人出生;Reddit 上线
[graduation season · attacking technology Er] three turns around the tree, what branch can we rely on?
2008R2 precautions for configuring L2TP pre shared key VPN
Fais ce que tu veux.
Four methods of object merging and four methods of object merging in JS
26. delete duplicates of ordered array
Cook a delicious cli
24. image mosaic operation
[Qianfan 618 countdown!] IAAs operation and maintenance special preferential activities
A method of generating non repeated numbers in nodejs
图片的可视化呈现有效增强大屏吸引力
Internship experience sharing in ByteDance 𞓜 ten thousand word job guide
【本周六活动】.NET Day in China
Investing in a good navigation framework from the beginning of the jetpack compose tutorial will help you save a lot of migration work later
Hbuilder makes hero skin lottery games
MYSQL_精讲数据库数据类型