InfiniteTalk:无限长虚拟人视频生成的新范式
为解决虚拟人长视频生成的质量退化问题,基础研发平台/计算和智能平台部/视觉智能团队推出 InfiniteTalk 技术,实现无限时长视频生成。该技术口型精准且动作流畅,支持"语音驱动图像"和"语音驱动视频"多种模式,已在 GitHub 开源并获 1.6K Stars, Hugging Face 月下载量 64.8K,受到了很多好评,能够应用到电商直播、教育、影视等领域。 项目开源信息 项目主页 :https://meigen-ai.github.io/InfiniteTalk/ 开源代码 :https://github.com/MeiGen-AI/InfiniteTalk 技术报告 :https://arxiv.org/abs/2508.14033 应用场景 营销: 电商营销视频、商家数字人直播、虚拟人导购 培训:虚拟人讲师、虚拟人陪练、在线教育 娱乐:短视频创作、虚拟偶像、游戏 01 引言------video dubbing 的一个长期痛点 传统 video dubbing 技术长期受限于其固有的"口型僵局",即仅能编辑嘴部区域,导致配音所传递的情感与人物的面部、肢体表达严重脱节,...



