设为首页|收藏本站|
开启左侧

[科技] 背靠清华,“国产最强”Sora来了!

[复制链接]
11 0
宗关勇 发表于 2024-4-28 19:38:19 | 只看该作者 打印 上一主题 下一主题
 
背靠清华,“国产最强”Sora来了! 第1张图片



启明百度智谱蚂蚁,均已入股。
文丨猎云精选 ID:lieyunjingxuan
作者丨王非

ChatGPT到Sora,大模型热潮汹涌依旧。距离Sora发布仅两个多月,“中国版Sora”就已经从概念和口号,成为了现实。4月27日,生成式人工智能基础设施及应用提供商生数科技,刚刚正式发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。仅从时长来看,相较于Sora长达60秒的视频生成能力,Vidu已然达到了前者的26.67%的水平。而在视频效果上,Vidu也堪称“媲美”。基于此,生数科技颇有底气地为Vidu,打上了“全面对标Sora”的标签。值得一提的是,与2023年,清华系占据大模型赛道半壁江山,如出一辙。此次,Vidu的诞生,也和清华关系匪浅。首先,Vidu正是由生数科技联合清华大学共同发布的。其次,生数科技的首席科学家正是清华大学计算机系教授、人工智能研究院副院长朱军。第三,生数科技的CEO唐家渝本硕就读于清华大学计算机系;CTO鲍凡则是清华大学计算机系博士生、朱军教授的课题组成员。仅凭强大的团队组成,生数科技就成为了资本市场上炙手可热的存在。在过去七个月内,刚刚成立一年多的生数科技,接连完成三轮大额融资,蚂蚁集团、百度、锦秋基金、启明创投、智谱AI均已成为该公司股东,并助推其成为目前国内在多模态大模型赛道估值最高的创业团队。
全面对标Sora!16秒+1080P

当地时间2月15日,OpenAI正式发布文生视频模型Sora,并发布了48个文生视频案例和技术报告,宣告入局视频生成领域。自此,国内多模态大模型赛道,热度不断攀升。早在2023年6月,就明确表示“正积极打造世界领先的可控多模态通用大模型”的生数科技,似乎已然具备了先发优势。事实,确也如此。据钛媒体消息,今年三月唐家渝曾表示,生数科技的视频生成长度在4-5秒左右,“我们近期将重点突破长视频生成能力……尤其长视频画面的连贯性。”谈及与Sora的竞争,唐家渝城,“整体上来讲,我们(中国)追赶Sora肯定比追赶GPT-4容易一些。今年一定能达到Sora目前版本的效果,很难说是三个月还是半年。”一个月过去,唐家渝的目标进度,显然迈进了一大步。生数科技介绍称,Vidu不仅能够模拟真实物,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。Vidu也是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。在时长方面,Vidu能够根据提供的文本描述直接生成长达16秒的高质量视频。换言之,生数科技已经相较于一个月前,有了3-4倍的成长。除了在时长方面的突破外,Vidu在视频效果方面实现显著提升,主要体现在几个方面:模拟真实物理世界:能够生成细节复杂的场景,且符合真实的物理规律,例如合理的光影效果、细腻的人物表情等;
背靠清华,“国产最强”Sora来了! 第2张图片

来源:
生数科技

具有丰富想象力:能够生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容。
背靠清华,“国产最强”Sora来了! 第3张图片


来源:
生数科技
多镜头语言:能够生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能够围绕统一主体在一段画面里就实现远景、近景、中景、特写等不同镜头的切换,包括能直接生成长镜头、追焦、转场等效果,给视频注入镜头语言;
背靠清华,“国产最强”Sora来了! 第4张图片

来源:
生数科技

时空一致性高:在16秒的时长上保持连贯流畅,随着镜头的移动,人物和场景在时间、空间中能够保持一致;
背靠清华,“国产最强”Sora来了! 第5张图片


来源:生数科技



上一篇:华为Pura 70系列上手体验:既要标新立异,也要风格统一
下一篇:消息称三星正准备8G + 128G版Galaxy S24手机,售74999卢比
@



1.西兔生活网 CTLIVES 内容全部来自网络;
2.版权归原网站或原作者所有;
3.内容与本站立场无关;
4.若涉及侵权或有疑义,请点击“举报”按钮,其他联系方式或无法及时处理。
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

排行榜
活跃网友
返回顶部快速回复上一主题下一主题返回列表APP下载手机访问
Copyright © 2016-2028 CTLIVES.COM All Rights Reserved.  西兔生活网  小黑屋| GMT+8, 2024-5-27 18:13