通义万相团队发布 Wan2.5-Preview,实现多模态输入与电影级视频同步生成
通义万相团队宣布Wan2.5-Preview已上线,首次原生支持音画同步,全面提升视频生成、图像生成、图像编辑三大核心能力,满足广告、电商、影视等商业级内容生产需求。
体验入口:https://tongyi.aliyun.com/
Wan2.5-Preview主要特性如下:
🎬 视频生成 —— 会“配音”的10秒电影
- 原生音画同步:视频自带人声(多人)、ASMR、音效、音乐,支持中文、英文、小语种及方言,画面与声音严丝合缝;
- 10秒长视频生成:时长提升1倍,最高支持1080P 24fps,动态表现力与结构稳定性大幅提升,叙事能力跃升;
- 指令遵循提升:支持复杂连续变化指令、运镜控制、结构化提示词,精准还原用户意图;
- 图生视频保 ID 优化:人物、商品等视觉元素一致性显著提升,商业广告与虚拟偶像场景可用;
- 通用音频驱动:支持上传自定义音频作为参考,搭配提示词或首帧图生成视频,实现“用我的声音讲你的故事”。
🖼️ 文生图 —— 能“写字”的设计大师
- 美学质感提升:真实光影、细节质感表现力增强,擅长不同艺术风格与设计质感还原;
- 稳定文字生成:支持中英文、小语种、艺术字、长文本、复杂构图精准渲染,海报/LOGO一次成型;
- 图表直接生成:可输出科学图表、流程图、数据图、架构图、文字内容表格等结构化图文;
- 指令遵循提升:复杂指令精细化理解,具备逻辑推理能力,可精准还原现实IP形象与场景细节。
✂️ 图像编辑 —— “改字不崩脸”的工业级修图
- 指令编辑:支持丰富编辑任务(换背景/改颜色/加元素/调风格),指令理解精准,无需专业PS技能;
- 一致性保持:支持单图/多图参考垫图,人脸、商品、风格等视觉元素ID强保持,编辑后“人还是那个人,包还是那个包”。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
蚂蚁集团开源智能编程助手 Neovate Code
蚂蚁集团支付宝体验技术部正式对外开源智能编程助手 Neovate Code,能够深度理解你的代码库,遵循既有编码习惯,并在上下文感知的基础上,精准地完成功能实现、Bug 修复和代码重构。它集成了 Code Agent 所需的核心能力。 Neovate Code 主要功能包括: 对话式开发- 用于编程任务的自然对话界面 AGENTS.md 规则文件- 为你的项目定义自定义规则和行为 会话继续和恢复- 跨会话继续之前的工作 支持流行的模型和提供商- OpenAI、Anthropic、Google 等 斜杠命令- 常用操作的快速命令 输出样式- 自定义代码更改的呈现方式 计划模式- 在执行前审查实现计划 无头模式- 在没有交互提示的情况下自动化工作流 插件系统- 用自定义插件扩展功能 MCP- 用于增强集成的模型上下文协议 Git 工作流- 智能提交消息和分支管理 ... 目前,Neovate Code 以 CLI 工具的形态提供,但其架构设计高度灵活,未来将支持多种客户端形态,适配更多开发场景。 开源地址:https://github.com/neovateai/neovate-code
-
下一篇
夸克发布全新 AI 创作平台“造点”
夸克宣布全新AI图像与视频创作平台“造点”已正式上线,拥有AI生图、AI生视频、P图、编辑一体化等功能,搭载通义万相Wan2.5、图像生成模型Midjourney V7、夸克图片模型1.0等多个模型,致力于为用户们提供更懂中国元素、更具实用性、更高性价比的图像与视频创作工具。 AI生图:亚洲人像生成更真实、中文生成更准确、更懂中国风。能驾驭多种艺术风格,适用于多元实用场景,让每个人都能做出好设计。 AI生视频:更高能的视频创作神器,支持原生音画同步生成、音频驱动视频生成等,普通人也能实现自己的导演梦。 根据官方介绍,从今天起到9月30日,所有用户可通过夸克PC端点击“AI生图”或访问zaodian.quark.cn进入“造点”平台,限时7天免费体验通义万相Wan2.5的视频生成能力。
相关文章
文章评论
共有0条评论来说两句吧...