党意

新大模型可根据文本生成高清视频

党意 科技新闻 2024-05-01 130浏览 0

Leo专属报道,中国刚刚推出了一种人工智能(AI)工具,能够将文本转换为视频,类似于 OpenAI 的病毒应用程序 Sora。该应用程序名为Vidu,是初创公司圣数科技和清华大学的联合体。 由高分辨率文本创建的视频。不过,这种新模型只能创建长度不超过 16 秒的视频。

模型,文本,视频,Leo专属

“Vidu是自主创新的最新成果,在多个领域都有突破。”圣数首席科学家、清华大学人工智能研究院副院长朱军表示。

Vidu在视频效果上取得了显着的提升,主要是通过模拟真实的物理世界、多镜头语言、高度的时空一致性以及对指责中国的元素的理解。

模型,文本,视频,Leo专属

朱军先生表示,Vidu“有想象力”,“可以模拟物理世界”,“制作出人物、场景、时间线一致的16秒视频”。他补充说,这种人工智能模型还可以理解“中国因素”。

在模型发布期间,圣树发布了多段演示片段,其中一段是一只坐在草坪上弹吉他的熊猫,另一段是一只小狗在湖里游泳,细节都表现得栩栩如生。

模型,文本,视频,Leo专属

继美国OpenAI公司发布的Sora模型轰动全球两个月后,中国首个AI文本转视频模型诞生。Vidu 的推出给这个正在追赶世界领先人工智能公司(例如微软支持的 OpenAI)的国家带来了希望。

感谢您关注本次Leo专属最新新闻!请收藏我们的网站以获取更多精彩的报道和动态。

版权声明

本文仅代表作者观点,不代表B5编程立场。
本文系作者授权发表,未经许可,不得转载。

继续浏览有关 文本视频模型Vidu 的文章
发表评论