腾讯混元发布并开源图生视频模型,支持生成背景音效及 2K 视频
3月6日,腾讯混元宣布推出图生视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K高质量视频。
开源内容包含权重、推理代码和LoRA训练代码,支持开发者基于混元训练专属LoRA等衍生模型。
目前在Github、HuggingFace等主流开发者社区均可下载体验。
- Github: https://github.com/Tencent/HunyuanVideo-I2V
- Huggingface:https://huggingface.co/tencent/HunyuanVideo-I2V
据介绍,基于图生视频的能力,用户只需上传一张图片,并简短描述希望画面如何运动、镜头如何调度等,混元即可按要求让图片动起来,变成5秒的短视频,还能自动配上背景音效。
此外,上传一张人物图片,并输入希望“对口型”的文字或音频,图片中的人物即可“说话”或“唱歌”;使用“动作驱动”能力,还能一键生成同款跳舞视频。
目前用户通过混元AI视频官网即可体验(https://video.hunyuan.tencent.com/),企业和开发者可在腾讯云申请使用API接口使用。
腾讯混元表示,此次开源的图生视频模型,是混元文生视频模型开源工作的延续,模型总参数量保持 130 亿,模型适用于多种类型的角色和场景,包括写实视频制作、动漫角色甚至CGI角色制作的生成。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Manus 邀请码炒至 6 万元,官方称将逐步有序释放
自发布以后,Manus 受到了热烈追捧,网友纷纷涌向 Manus 官网,从而导致页面一度因访问量过大而崩溃。目前,试用Manus需要输入邀请码,这导致邀请码一码难求。在二手交易平台上,邀请码的价格被炒至几百元到 6 万元不等。 针对邀请码炒作问题,Manus AI 合伙人张涛在社交平台做出了回应。他首先感谢了大家对 Manus 的关注,并澄清了几点重要信息:一是公司从未开设任何付费获取邀请码的渠道;二是从未投入任何市场推广预算;三是内测期间系统容量有限,公司将优先保障现有用户的核心体验,并逐步有序释放邀请码。 张涛称,“目前采取邀请码机制,是因为此刻服务器容量确实有限,不得已而为之,团队也熬夜搞了一整天了。希望在接下来的时间里能让更多处在 waitlist 中的用户优先体验 Manus。” “恳请大家对一家几十人的创业公司多一点包容和理解,团队正在全力输出,让大家早日体验上更好的产品。” 相关阅读: Monica.im 发布 AI Agent 产品「Manus」
- 下一篇
trustcall —— 基于 LangGraph 的强大工具调用库
当被要求生成或修改大型 JSON blob 时,LLM 会遇到困难。trustcall可通过要求 LLM 生成JSON 补丁操作来解决这个问题。这使得: 更快、更便宜地生成结构化输出。 即使对于复杂的嵌套模式(定义为 pydantic、模式字典或常规 python 函数)也可以弹性重试验证错误 准确更新现有模式,避免不必要的删除。 可灵活适用于多种常见的 LLM 工作流程,例如: Extraction LLM routing Multi-step agent tool use
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Hadoop3单机部署,实现最简伪集群
- CentOS7安装Docker,走上虚拟化容器引擎之路
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS8编译安装MySQL8.0.19
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7设置SWAP分区,小内存服务器的救世主