1.jpg (116.73 KB, 下载次数: 0)
下载附件 保存到相册
2024-2-17 17:56 上传
简单粗暴的理解,就是语言能力足够强大之后,它带来的泛化能力直接可以学习图像视频数据和它体现出的模式,然后还可以直接用学习来的图像生成模型最能理解的方式,给这些利用了引擎等已有的强大而成熟的视频生成技术的视觉模型模块下指令,最终生成我们看到的逼真而强大的对物理世界体现出“理解”的视频。
2.jpg (35.65 KB, 下载次数: 0)
3.jpg (35.74 KB, 下载次数: 0)
4.jpg (59.28 KB, 下载次数: 0)
5.jpg (53.57 KB, 下载次数: 0)
使用道具 举报
本版积分规则 发表回复 回帖并转播 回帖后跳转到最后一页
0关注
2粉丝
51帖子
扫一扫用手机访问