多模态AI下一步是3D内容生成？新工具已火爆GitHub

讯石光通讯网发布时间:2024/3/5 11:03:14 编者:iccsz

摘要：多模态内容生成展示了AIGC广阔的应用空间， 3D有望成为下一个实现突破的模态。

ICC讯 多模态内容生成展示了AIGC广阔的应用空间， 3D有望成为下一个实现突破的模态。

近期，一款名为DUSt3R的AI新工具火爆微软旗下GitHub平台，只需2张图片2秒钟就能完成3D重建，无需测量任何额外数据。这款AI工具才上线没多久就登上GitHub热榜第二。有网友实测，拍两张照片就重建出了他家的厨房，整个过程耗时不到2秒钟。

3D模型生成通常需要MVS估计相机参数，并在3D空间中对相应的像素进行三角测量。该产品同原来不一样的是，它是一种对任意图像进行3D立体重建的全新范式，不需要相机校准以及视点姿态等先验信息。从而可以实现提供两个以上图像的情况下，进行3D建模重建。

3D建模指的是使用软件来创建三维对象或形状的数学表示形式的过程。3D建模技术和3D模型广泛应用于医疗、游戏、影视、建筑、产品设计还是虚拟现实等领域。

AI+3D建模是利用人工智能技术，自动化地生成高质量的3D模型的过程。传统的3D建模需要艺术家花费大量时间和精力进行手工创作，而AI生成则通过训练机器学习算法，使计算机能够自动学习和生成3D模型，极大地提高了效率和准确性，同时降低了整个制作成本。

用户只需要输入关键词或者上传一张2D图片，这些工具就能在段时间内直接生成多个比较初步的3D模型，而用户满意的话，则可以选择进一步生成精度更高的3D模型。

当下的3D内容生成工具已经不少，目前海外在AI+3D技术上主要分为工业场景探索与非工业场景探索。非工业场景应用探索主要以谷歌的DreamFusion和英伟达的Magic3D为代表，主要面向游戏、元宇宙中的3D资产设计；工业场景应用则主要以衍生式设计软件为主，如PTC的Creo以及Autodesk的Fushion360均提供衍生式设计能力。

国内比较知名的3D生成AI模型包括：字节跳动研究团队开发的MVDream；由幻方量化旗下的一家大模型企业DeepSeek开发的DreamCraft3D；影眸科技从2016年开始进行人脸采集生成3D模型的业务。据该公司CTO张启煊介绍，其人脸生成3D的服务，应该是目前国内3D生成里面唯一一个走进游戏生产端的产品……

用户输入文本：“奔跑在树林中，搞笑的猪头和孙悟空身体的混合形像”，DreamCraft3D生成的内容

从ChatGPT代表的文生文，到DALL?E代表的文生图，再到Sora代表的文生视频，多模态已经成为了共识的AI发展趋势。中泰证券旗帜鲜明地提出，继文本、代码、图片、视频之后，下一个有可能实现突破的模态大概率是3D，“SORA之后的下一步：文生3D”。未来随着数字化的持续发展，3D资产数量的快速增长，3D建模的自动化生成或成为新的发展风口，而以各种大模型为代表的AIGC生产能力赋能3D建模，以及文生3D需求持续增长，都将促进AI赋能3D建模的快速发展。

不过AI+3D建模技术当前也面临较多挑战，如3D数据与资产缺乏、AI训练难度高、AI实时渲染技术有限、商业化落地难度大等问题。

该机构进一步称，产业视角建议持续跟踪关注文生3D建模领域的进展，标的视角BIM领域重点关注广联达、盈建科；CAX领域重点关注中望软件、索辰科技、浩辰软件；EDA领域重点关注华大九天、概伦电子。

内容来自：财联社
本文地址：http://www.iccsz.com//Site/CN/News/2024/03/05/20240305030430945542.htm 转载请保留文章出处
关键字:
文章标题:多模态AI下一步是3D内容生成？新工具已火爆GitHub

1、凡本网注明“来源：讯石光通讯网”及标有原创的所有作品，版权均属于讯石光通讯网。未经允许禁止转载、摘编及镜像，违者必究。对于经过授权可以转载我方内容的单位，也必须保持转载文章、图像、音视频的完整性，并完整标注作者信息和本站来源。
2、免责声明，凡本网注明“来源：XXX（非讯石光通讯网）”的作品，均为转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。因可能存在第三方转载无法确定原网地址，若作品内容、版权争议和其它问题，请联系本网，将第一时间删除。
联系方式：讯石光通讯网新闻中心　电话：0755-82960080-168 Right

多模态AI下一步是3D内容生成？ 新工具已火爆GitHub

相关新闻

多模态AI下一步是3D内容生成？新工具已火爆GitHub