Soul 开源实时数字人生成模型 SoulX-FlashTalk
Soul App AI团队(Soul AI Lab)已开源实时数字人生成模型SoulX-FlashTalk。这是首个能够实现0.87s亚秒级超低延时、32fps高帧率,并支持超长视频稳定生成的14B数字人模型,在速度、效果、延迟和保真度上表现出色。 模型通过双向注意力机制与自纠正双向蒸馏技术,有效抑制长视频生成中的身份漂移与画质下降,并实现全身动作交互与高精细手部表现。在TalkBench数据集评测中,其以3.51的ASE、4.79的IQA及1.47的Sync-C分数全面领先现有模型。 该技术可广泛应用于电商直播、智能客服、在线教育等场景,推动实时数字人技术迈向低成本、高保真的商业化应用新阶段。项目已公开技术报告、源代码及Hugging Face模型权重,供开发者研究与使用。 Project Page:https://soul-ailab.github.io/soulx-flashtalk/ Technical Report:https://arxiv.org/pdf/2512.23379 Source Code:https...


