通义万相预告新模型 Wan2.2-S2V
通义万相团队深夜发布预告推文,称即将推出新模型 Wan2.2-S2V,该模型将具备生成带音频视频的能力。
通义万相Wan2.2是一款开源视频生成模型,它率先在视频生成扩散模型中引入 MoE 架构,有效解决视频生成处理 Token 过长导致的计算资源消耗大问题。Wan2.2 还首创了「电影美学控制系统」,光影、色彩、构图、微表情等能力媲美专业电影水平。例如,用户输入「黄昏」、「柔光」、「边缘光」、「暖色调」「中心构图」等关键词,模型可自动生成金色的落日余晖的浪漫画面;使用「冷色调」、「硬光」、「平衡图」、「低角度」的组合,则可以生成接近科幻片的画面效果。
