用户名: 密码: 验证码:

字节跳动发布两款视频生成大模型 面向企业市场开启邀测

摘要:字节跳动火山引擎发布豆包视频生成模型,采用DiT架构和扩散模型训练,具备多镜头语言能力,正在内测,未来将开放给用户。

  ICC讯 9月24日,字节跳动旗下火山引擎发布两款视频生成大模型(豆包视频生成-PixelDance、豆包视频生成-Seaweed),首次面向企业市场开启邀测。

  火山引擎介绍,豆包视频生成模型基于DiT架构,通过高效的DiT融合计算单元,能更充分地压缩编码视频与文本,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。

  此外,豆包视频生成模型另外一大技术创新是全新设计的扩散模型训练方法攻克了多镜头切换的一致性难题。该模型还使用深度优化的Transformer结构,大幅提升视频生成的泛化能力。

  字节跳动透露,目前,新款豆包视频生成模型正在即梦AI内测版小范围测试,未来将逐步开放给所有用户。

1、凡本网注明“来源:讯石光通讯网”及标有原创的所有作品,版权均属于讯石光通讯网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、免责声明,凡本网注明“来源:XXX(非讯石光通讯网)”的作品,均为转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。因可能存在第三方转载无法确定原网地址,若作品内容、版权争议和其它问题,请联系本网,将第一时间删除。
联系方式:讯石光通讯网新闻中心 电话:0755-82960080-168   Right