OpenAI 推出 Shap・E:基于文本数秒内生成高质量 3D 模型

OpenAI 推出 Shap・E:基于文本数秒内生成高质量 3D 模型

5 月 9 日消息,继文本生成图片模型 DALL・E 之后,OpenAI 近日再次发布了 Shap・E 模型。用户可以输入文本,用于创建逼真且多样化的 3D 模型。

OpenAI 推出 Shap・E:基于文本数秒内生成高质量 3D 模型

Shap・E 并不仅仅只是一个 3D 模型生成器,而且可以直接生成隐式函数(implicit functions)的参数,而这些参数可以渲染纹理网格(textured meshes)和神经辐射场(NeRF)。

这意味着 Shap・E 和当前仅输出点云(point clouds)或体素(voxels)的模型不同,可以生成具有细粒度纹理和复杂形状的高质量 3D 资产。

OpenAI 展示了 Shap・E 的结果,例如一碗食物,一只企鹅,一只体素化的狗,一个篝火,一把鳄梨形的椅子等。整个图片可以在几秒内完成渲染。

OpenAI 推出 Shap・E:基于文本数秒内生成高质量 3D 模型

附相关名词解释如下:

神经辐射场(NeRF):

神经辐射场(Neural Radiance Field, NeRF)作为一种具有隐式场景表示的新型视场合成技术,在计算机视觉领域引起了广泛的关注。

作为一种新颖的视图合成和三维重建方法,NeRF 模型在机器人、城市地图、自主导航、虚拟现实 / 增强现实等领域都有广泛的应用。

点云(point clouds):

云点是一系列落在三维坐标系统里的点,他们可以在建筑表面或建筑外立面展开,以捕捉建筑外观的形态。

体素(voxels)

体素是 3D 空间的像素。量化的,大小固定的点云。每个单元都是固定大小和离散坐标。

© 版权声明

相关文章