您现在的位置是:首页 > 文章详情

通义万相团队发布 Wan2.5-Preview,实现多模态输入与电影级视频同步生成

日期:2025-09-24点击:11

通义万相团队宣布Wan2.5-Preview已上线,首次原生支持音画同步,全面提升视频生成、图像生成、图像编辑三大核心能力,满足广告、电商、影视等商业级内容生产需求。

体验入口:https://tongyi.aliyun.com/

Wan2.5-Preview主要特性如下:

🎬 视频生成 —— 会“配音”的10秒电影

  • 原生音画同步:视频自带人声(多人)、ASMR、音效、音乐,支持中文、英文、小语种及方言,画面与声音严丝合缝;
  • 10秒长视频生成:时长提升1倍,最高支持1080P 24fps,动态表现力与结构稳定性大幅提升,叙事能力跃升;
  • 指令遵循提升:支持复杂连续变化指令、运镜控制、结构化提示词,精准还原用户意图;
  • 图生视频保 ID 优化:人物、商品等视觉元素一致性显著提升,商业广告与虚拟偶像场景可用;
  • 通用音频驱动:支持上传自定义音频作为参考,搭配提示词或首帧图生成视频,实现“用我的声音讲你的故事”。

🖼️ 文生图 —— 能“写字”的设计大师

  • 美学质感提升:真实光影、细节质感表现力增强,擅长不同艺术风格与设计质感还原;
  • 稳定文字生成:支持中英文、小语种、艺术字、长文本、复杂构图精准渲染,海报/LOGO一次成型;
  • 图表直接生成:可输出科学图表、流程图、数据图、架构图、文字内容表格等结构化图文;
  • 指令遵循提升:复杂指令精细化理解,具备逻辑推理能力,可精准还原现实IP形象与场景细节。

✂️ 图像编辑 —— “改字不崩脸”的工业级修图

  • 指令编辑:支持丰富编辑任务(换背景/改颜色/加元素/调风格),指令理解精准,无需专业PS技能;
  • 一致性保持:支持单图/多图参考垫图,人脸、商品、风格等视觉元素ID强保持,编辑后“人还是那个人,包还是那个包”。
原文链接:https://www.oschina.net/news/374213
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章