用户名: 密码: 验证码:

多模态AI下一步是3D内容生成? 新工具已火爆GitHub

摘要:多模态内容生成展示了AIGC广阔的应用空间, 3D有望成为下一个实现突破的模态。

  ICC讯 多模态内容生成展示了AIGC广阔的应用空间, 3D有望成为下一个实现突破的模态。

  近期,一款名为DUSt3R的AI新工具火爆微软旗下GitHub平台,只需2张图片2秒钟就能完成3D重建,无需测量任何额外数据。这款AI工具才上线没多久就登上GitHub热榜第二。有网友实测,拍两张照片就重建出了他家的厨房,整个过程耗时不到2秒钟。

  3D模型生成通常需要MVS估计相机参数,并在3D空间中对相应的像素进行三角测量。该产品同原来不一样的是,它是一种对任意图像进行3D立体重建的全新范式,不需要相机校准以及视点姿态等先验信息。从而可以实现提供两个以上图像的情况下,进行3D建模重建。

  3D建模指的是使用软件来创建三维对象或形状的数学表示形式的过程。3D建模技术和3D模型广泛应用于医疗、游戏、影视、建筑、产品设计还是虚拟现实等领域

  AI+3D建模是利用人工智能技术,自动化地生成高质量的3D模型的过程。传统的3D建模需要艺术家花费大量时间和精力进行手工创作,而AI生成则通过训练机器学习算法,使计算机能够自动学习和生成3D模型,极大地提高了效率和准确性,同时降低了整个制作成本。

  用户只需要输入关键词或者上传一张2D图片,这些工具就能在段时间内直接生成多个比较初步的3D模型,而用户满意的话,则可以选择进一步生成精度更高的3D模型。

  当下的3D内容生成工具已经不少,目前海外在AI+3D技术上主要分为工业场景探索与非工业场景探索。非工业场景应用探索主要以谷歌的DreamFusion和英伟达的Magic3D为代表,主要面向游戏、元宇宙中的3D资产设计;工业场景应用则主要以衍生式设计软件为主,如PTC的Creo以及Autodesk的Fushion360均提供衍生式设计能力。

  国内比较知名的3D生成AI模型包括:字节跳动研究团队开发的MVDream;由幻方量化旗下的一家大模型企业DeepSeek开发的DreamCraft3D;影眸科技从2016年开始进行人脸采集生成3D模型的业务。据该公司CTO张启煊介绍,其人脸生成3D的服务,应该是目前国内3D生成里面唯一一个走进游戏生产端的产品……

  用户输入文本:“奔跑在树林中,搞笑的猪头和孙悟空身体的混合形像”,DreamCraft3D生成的内容

  从ChatGPT代表的文生文,到DALL?E代表的文生图,再到Sora代表的文生视频,多模态已经成为了共识的AI发展趋势。中泰证券旗帜鲜明地提出,继文本、代码、图片、视频之后,下一个有可能实现突破的模态大概率是3D,“SORA之后的下一步:文生3D”。未来随着数字化的持续发展,3D资产数量的快速增长,3D建模的自动化生成或成为新的发展风口,而以各种大模型为代表的AIGC生产能力赋能3D建模,以及文生3D需求持续增长,都将促进AI赋能3D建模的快速发展。

  不过AI+3D建模技术当前也面临较多挑战,如3D数据与资产缺乏、AI训练难度高、AI实时渲染技术有限、商业化落地难度大等问题。

  该机构进一步称,产业视角建议持续跟踪关注文生3D建模领域的进展,标的视角BIM领域重点关注广联达、盈建科;CAX领域重点关注中望软件、索辰科技、浩辰软件;EDA领域重点关注华大九天、概伦电子。

内容来自:财联社
本文地址:http://www.iccsz.com//Site/CN/News/2024/03/05/20240305030430945542.htm 转载请保留文章出处
关键字:
文章标题:多模态AI下一步是3D内容生成? 新工具已火爆GitHub
1、凡本网注明“来源:讯石光通讯网”及标有原创的所有作品,版权均属于讯石光通讯网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、免责声明,凡本网注明“来源:XXX(非讯石光通讯网)”的作品,均为转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。因可能存在第三方转载无法确定原网地址,若作品内容、版权争议和其它问题,请联系本网,将第一时间删除。
联系方式:讯石光通讯网新闻中心 电话:0755-82960080-168   Right