阿里巴巴开源视频生成与编辑模型通义万相 Wan2.1-VACE
阿里巴巴正式开源通义万相 Wan2.1-VACE,这是一款支持视频生成与编辑的模型,单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力。
据悉,本次共开源 1.3B 和 14B 两个版本,其中 1.3B 版本可在消费级显卡运行。
作为业内首个开源的视频编辑统一模型,VACE以Wan2.1文生视频模型为基础,创新性地在一个单一模型中同时支持包括文生视频、图像参考视频生成、视频转绘、视频局部编辑以及视频扩展等多种生成和编辑能力。
- 多模态信息输入,提高视频生成可控性
- 统一的单一模型,为多种任务提供更加统一的解决方案
- 多任务自由组合,可以更加深度地挖掘视频生成的创意潜力
可在魔搭社区、Hugging face、GitHub等社区获取。VACE部分功能也将在通义万相官网上线。
✅魔搭社区:https://modelscope.cn/organization/Wan-AI
✅ GitHub:网页链接
✅ Hugging face:网页链接
通义万相是阿里云通义系列 AI 绘画创作大模型,可辅助人类进行图片创作,于 2023 年 7 月 7 日正式上线。在 2024 年 9 月 19 日的阿里云栖大会上,阿里发布了通义万相视频生成大模型。该模型可以生成影视级高清视频,而且更能听懂中国话。
值得注意的是,今年 1 月初通义万相视频生成模型宣布升级至 2.1 版,模型整体性能大幅提升,尤其是在处理复杂运动、还原真实物理规律、提升电影质感及优化指令遵循方面取得了显著进展。2 月 25 日,阿里巴巴宣布全面开源旗下视频生成模型万相 2.1 模型。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
华为将推出鸿蒙折叠电脑
华为终端官方微博发布预告称: 5月19日14:30,nova 14系列及鸿蒙电脑新品发布会,鸿蒙电脑邀您一起展开新篇章。 多方消息称,在此次新品发布会上,华为公司将推出鸿蒙折叠电脑。 相关阅读: 首款鸿蒙电脑正式亮相
- 下一篇
OpenAI 开放 GPT-4.1 使用
OpenAI 官方宣布将于昨日(5 月 14 日)开始,在 ChatGPT AI 聊天机器人中引入 GPT-4.1 模型。 Pro、Plus 和 Team 用户可以通过“More models”下拉菜单立即选择该模型,而 Enterprise 和 Edu 用户预计在未来几周内获得访问权限。同时,GPT-4.1 mini 取代了 GPT-4o-mini,并向所有 ChatGPT 用户开放。 GPT-4.1 在具体表现上表现出色。OpenAI 声称,该模型特别擅长处理编程任务,能精确遵循指令,避免不必要的冗长输出。 在实际测试中,GPT-4.1 比 GPT-4o 更注重效率,不再过度聊天,这让它在专业场景中更可靠。同时,其整体性能与最新版 GPT-4o 相当,甚至在某些方面更胜一筹。 与旧版 GPT-4o 相比,GPT-4.1 带来了更全面的提升。这不仅体现在任务执行的精确性上,还包括更稳定的输出质量。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS6,CentOS7官方镜像安装Oracle11G
- Mario游戏-低调大师作品
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7