Leo专属报道,中国刚刚推出了一种人工智能(AI)工具,能够将文本转换为视频,类似于 OpenAI 的病毒应用程序 Sora。该应用程序名为Vidu,是初创公司圣数科技和清华大学的联合体。 由高分辨率文本创建的视频。不过,这种新模型只能创建长度不超过 16 秒的视频。
“Vidu是自主创新的最新成果,在多个领域都有突破。”圣数首席科学家、清华大学人工智能研究院副院长朱军表示。
Vidu在视频效果上取得了显着的提升,主要是通过模拟真实的物理世界、多镜头语言、高度的时空一致性以及对指责中国的元素的理解。
朱军先生表示,Vidu“有想象力”,“可以模拟物理世界”,“制作出人物、场景、时间线一致的16秒视频”。他补充说,这种人工智能模型还可以理解“中国因素”。
在模型发布期间,圣树发布了多段演示片段,其中一段是一只坐在草坪上弹吉他的熊猫,另一段是一只小狗在湖里游泳,细节都表现得栩栩如生。
继美国OpenAI公司发布的Sora模型轰动全球两个月后,中国首个AI文本转视频模型诞生。Vidu 的推出给这个正在追赶世界领先人工智能公司(例如微软支持的 OpenAI)的国家带来了希望。
感谢您关注本次Leo专属最新新闻!请收藏我们的网站以获取更多精彩的报道和动态。
转载请注明:Leo专属,抢先看最新热点新闻! » 科技新闻 » 新大模型可根据文本生成高清视频
版权声明
本文仅代表作者观点,不代表B5编程立场。
本文系作者授权发表,未经许可,不得转载。
发表评论