字节跳动 Seedance 1.0 模型评测结果超越谷歌 Veo 3
在近期的人工智能视频生成领域,字节跳动悄然发布了一款名为 Seedance1.0的新模型,该模型在独立的评测中已经超越了谷歌最新推出的 Veo3。 Seedance1.0的研究论文中详细介绍了该模型的创新之处。字节跳动的团队通过对空间和时间层的解耦,结合了多模态位置编码,从而使得该模型能够同时处理文本到视频和图像到视频的生成任务。这样的方法支持复杂的场景切换和多镜头叙事,保持了一致的主题表现。 此外,Seedance1.0的性能离不开字节跳动强大的数据管道。团队精心构建了一个大规模、多来源的数据集,配有详细的双语注释和丰富的动作与静态特征标注,确保生成内容的准确性。同时,采用了一种新颖的强化学习设置,结合了三个奖励模型,重点关注基础对齐、动作质量和美观度。 在评测中,Seedance1.0在多个维度上超过了 Veo3。在与电影导演合作开发的 SeedVideoBench 基准测试中,该模型在遵循提示和动作真实感方面取得了更高的分数。在图像到视频的任务中,Seedance 保持了输入帧的视觉一致性,而 Veo3则在某些情况下出现了光照和纹理的变化。 在推理性能方面,Seedance1.0...

