新大模型可根据文本生成高清视频

党意科技新闻 2024-05-01 130浏览 0

Leo专属报道，中国刚刚推出了一种人工智能（AI）工具，能够将文本转换为视频，类似于 OpenAI 的病毒应用程序 Sora。该应用程序名为Vidu，是初创公司圣数科技和清华大学的联合体。由高分辨率文本创建的视频。不过，这种新模型只能创建长度不超过 16 秒的视频。

模型,文本,视频,Leo专属

“Vidu是自主创新的最新成果，在多个领域都有突破。”圣数首席科学家、清华大学人工智能研究院副院长朱军表示。

Vidu在视频效果上取得了显着的提升，主要是通过模拟真实的物理世界、多镜头语言、高度的时空一致性以及对指责中国的元素的理解。

模型,文本,视频,Leo专属

朱军先生表示，Vidu“有想象力”，“可以模拟物理世界”，“制作出人物、场景、时间线一致的16秒视频”。他补充说，这种人工智能模型还可以理解“中国因素”。

在模型发布期间，圣树发布了多段演示片段，其中一段是一只坐在草坪上弹吉他的熊猫，另一段是一只小狗在湖里游泳，细节都表现得栩栩如生。

模型,文本,视频,Leo专属

继美国OpenAI公司发布的Sora模型轰动全球两个月后，中国首个AI文本转视频模型诞生。Vidu 的推出给这个正在追赶世界领先人工智能公司（例如微软支持的 OpenAI）的国家带来了希望。

感谢您关注本次Leo专属最新新闻！请收藏我们的网站以获取更多精彩的报道和动态。

转载请注明：Leo专属，抢先看最新热点新闻！ » 科技新闻 » 新大模型可根据文本生成高清视频

版权声明

本文仅代表作者观点，不代表B5编程立场。
本文系作者授权发表，未经许可，不得转载。

继续浏览有关文本视频模型 Vidu 的文章

发表评论