通义万相全新动作生成模型 Wan2.2-Animate 正式开源
阿里云宣布通义万相全新动作生成模型 Wan2.2-Animate 正式开源。该模型能够驱动人物、动漫形象和动物照片,广泛应用于短视频创作、舞蹈模板生成、动漫制作等领域。用户可以在 GitHub、HuggingFace 和魔搭社区下载模型和代码,也可以通过阿里云百炼平台调用 API 或在通义万相官网直接体验。
Wan2.2-Animate 模型是基于此前开源的 Animate Anyone 模型全面升级的成果,在人物一致性、生成质量等指标上大幅提升,同时支持动作模仿和角色扮演两种模式。
在角色模仿模式下,输入一张角色图片和一段参考视频,模型可以将视频角色的动作和表情迁移到图片角色中,赋予图片角色动态表现力。而在角色扮演模式下,模型可以在保留原始视频的动作、表情及环境的基础上,将视频中的角色替换为图片中的角色。
通义万相团队构建了一个涵盖说话、面部表情和身体动作的大规模人物视频数据集,并基于通义万相图生视频模型进行后训练。Wan2.2-Animate 将角色信息、环境信息和动作等规范到统一的表示格式,实现了单一模型同时兼容两种推理模式。针对身体运动和脸部表情,模型分别使用骨骼信号和隐式特征,配合动作重定向模块,实现动作和表情的精准复刻。在替换模式中,团队还设计了一个独立的光照融合 LoRA,用于保证完美的光照融合效果。
实测结果显示,Wan2.2-Animate 在视频生成质量、主体一致性和感知损失等关键指标上超越了 StableAnimator、LivePortrait 等开源模型,成为目前性能最强的动作生成模型。在人类主观评测中,Wan2.2-Animate 甚至超越了以 Runway Act-two 为代表的闭源模型。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
XXL-TOOL v2.1.0 发布 | Java 工具类库
Release Notes 1、【新增】新增“令牌桶/限流器”工具,TokenBucket,支持 突发限流、预热限流 等模式; 2、【新增】新增“验证码”工具,CaptchaTool,支持字符验证码、算式验证码、中文验证码等多形式。支持自定义验证码生成算法、宽高、颜色、文字字体、文字大小、文字间距、背景颜色、边框宽度、边框颜色、干扰组件…等。 3、【新增】新增基础模块工具,包括:ArrayTool 等; 4、【强化】已有工具能力完善,包括:PropTool、StringTool 等; 5、【升级】升级依赖版本,包括gson、nimbus-jose-jwt、spring等; 简介 XXL-TOOL 是一个Java工具类库,致力于让Java开发更高效。包含 “日期、集合、字符串、IO、缓存、并发、Excel、Emoji、Response、Pipeline、Http、Json、JsonRpc、Encrypt、Auth、ID、Serializer、验证码、限流器...” 等数十个模块。 文档地址 中文文档:https://www.xuxueli.com/xxl-tool/ Github:htt...
-
下一篇
腾讯发布一站式工作平台“混元 3D Studio”
腾讯推出专为3D设计师、游戏开发者和建模师打造的AI工作台——混元3D Studio,可将3D资产生产周期从"天"级缩短至"分钟"级。 混元3D Studio1.0版本已上线角色和道具创作管线,整合了从概念设计、几何建模到贴图、蒙皮和动画制作的完整流程。平台依托行业领先的混元3D 模型,支持文本到图像生成,提供多种风格选项,并可将任意姿势角色转换为标准 A-pose。 该平台引入多项核心技术创新: 原生3D 分割算法:首创自动模型拆分技术,将模型分解为清晰部件,支持角色配饰和服装的独立编辑。 AI 语义 UV 展开:突破传统耗时且效果不佳的限制,1-2分钟内生成符合美术标准的 UV 图,工作效率大幅提升。 智能材质编辑:支持通过文本或图片输入生成高质量 PBR 质感纹理,实现精准材质控制。 自动绑骨蒙皮:支持人形及非人形角色的自动绑骨,结合动作模板快速生成动画效果。 混元3D Studio 升级了低模拓扑功能,新增多档面数控制,满足游戏开发者、动画制作者和工业设计师的不同需求。后续版本将推出地图、关卡等更多创作功能,进一步扩展应用场景。
相关文章
文章评论
共有0条评论来说两句吧...