通义万相团队发布 Wan2.5-Preview,实现多模态输入与电影级视频同步生成
通义万相团队宣布Wan2.5-Preview已上线,首次原生支持音画同步,全面提升视频生成、图像生成、图像编辑三大核心能力,满足广告、电商、影视等商业级内容生产需求。 体验入口:https://tongyi.aliyun.com/ Wan2.5-Preview主要特性如下: 🎬 视频生成 —— 会“配音”的10秒电影 原生音画同步:视频自带人声(多人)、ASMR、音效、音乐,支持中文、英文、小语种及方言,画面与声音严丝合缝; 10秒长视频生成:时长提升1倍,最高支持1080P 24fps,动态表现力与结构稳定性大幅提升,叙事能力跃升; 指令遵循提升:支持复杂连续变化指令、运镜控制、结构化提示词,精准还原用户意图; 图生视频保 ID 优化:人物、商品等视觉元素一致性显著提升,商业广告与虚拟偶像场景可用; 通用音频驱动:支持上传自定义音频作为参考,搭配提示词或首帧图生成视频,实现“用我的声音讲你的故事”。 🖼️ 文生图 —— 能“写字”的设计大师 美学质感提升:真实光影、细节质感表现力增强,擅长不同艺术风格与设计质感还原; 稳定文字生成:支持中英文、小语种、艺术字、长文本、复杂构图精准...


