6月22日 消息:英伟达再次尝试利用人工智能技术丰富普通2D图片的内容深度。在将2D 图像转换为3D场景、模型和视频后,该公司将重点转向了编辑功能。
这家 GPU 巨头日前推出了一种新的AI技术——3D MoMa,可以将静态照片转换为创作者可以轻松修改的3D 对象。
据介绍,这项被AI技术可以让游戏工作室实现轻松修改图像和场景的工作。3D MoMa 通过反向渲染加速了任务。这个过程中,主要使用人工智能分析静止图像进而估计场景的物理属性,包括几何结构、光照等。然后再将这些图片构建成为逼真的3D形式。
Nvidia 图形研究副总裁 David Luebke 将这项技术描述为“一个将计算机视觉和计算机图形结合在一起的圣杯”。Lubeke说:“通过将每一个反向渲染问题作为gpu加速可微组件来制定,NVIDIA3D MoMa渲染管道通过使用现代AI机器和NVIDIA gpu的原始计算能力实现快速生成3D对象,创造者可以在现有工具中不受限制地导入、编辑和扩展。”
3D MoMa 将对象生成为三角形网格——一种让广泛使用的工具可以直接编辑的格式。这些模型是在单个英伟达Tensor Core GPU上一个小时内创建的。
然后不同属性的材质可以像皮肤一样覆盖在网格上。还可以预测场景的照明,这使得创作者可以修改材质属性获得物体不同实现效果。