中国首个Sora级模型 Vidu 发布:生成最长16秒、最

2024-04-27 14:14:27

  生数科技今天出席中关村论坛未来人工智能先锋论坛,携手清华大学正式发布中国首个长时长、高一致性、高动态性大模型 ——Vidu,被媒体和业内人士认为是国内首个 Sora 级别的大模型。

  根据官方描述,Vidu 模型融合 Diffusion 与 Transformer,开创性创建了 U-ViT,

  官方宣传资料中演示了“画室中的一艘船驶向镜头”、其海浪、船的效果非常逼真。

  官方表示 Vidu 不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。

  Vidu 是自 Sora 发布之后,全球率先取得重大突破的大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。

  Vidu 的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项性成果。

  其核心技术 U-ViT 架构由团队于 2022 年 9 月提出,早于 Sora 采用的 DiT 架构,是全球首个 Diffusion 与 Transformer 融合的架构。

  2023 年 3 月,团队开源了全球首个基于 U-ViT 融合架构的多模态扩散模型 UniDiffuser,率先完成了 U-ViT 架构的大规模可扩展性验证。

  附上参考地址

下一篇:Steam 上线“东方游戏文化周”活动,《东方妖灵
上一篇:5 月初择机发射,嫦娥六号探测器完成垂直转运
返回顶部小火箭