Soul App 开源播客语音合成模型 SoulX-Podcast
近日,Soul App AI团队(Soul AI Lab)正式开源播客语音合成模型SoulX-Podcast。该模型是一款专为多人、多轮对话场景打造的语音生成模型,支持中、英、川、粤等多语种/方言与副语言风格,能稳定输出超60分钟、自然流畅、角色切换准确、韵律起伏丰富的多轮语音对话。
除了播客场景以外,SoulX-Podcast在通用语音合成或克隆场景下也表现出色,带来更真实、更生动的语音体验。
SoulX-Podcast表现
SoulX-Podcast亮点:流畅自然多轮对话、多方言、超长播客生成。
- 零样本克隆的多轮对话能力
在零样本克隆播客生成场景中,SoulX-Podcast 展现出卓越的语音生成能力。它不仅能高度还原参考语音的音色与风格,更能根据对话语境灵活调节韵律与节奏,让每一段对话都自然流畅、富有节奏感。
无论是多轮长时对话,还是情感层次丰富的交流,SoulX-Podcast 都能保持声音的连贯与表达的真实。此外,SoulX-Podcast 还支持笑声、清嗓等多种副语言元素的可控生成,让合成语音更具临场感与表现力。
- 多语种和跨方言的克隆能力
除中英文外,SoulX-Podcast同样支持四川话、河南话、粤语等多种主流方言。更值得关注的是,SoulX-Podcast实现了跨方言音色克隆——即便仅提供普通话的参考语音,模型也能灵活生成带有四川话、河南话、粤语等方言特征的自然语音。
- 超长播客生成
SoulX-Podcast可以支持超长播客的生成,并维持稳定的音色与风格。
SoulX-Podcast模型架构如下:
SoulX-Podcast开源地址
-
Demo Page: https://soul-ailab.github.io/soulx-podcast
-
Technical Report: https://arxiv.org/pdf/2510.23541
-
Source Code: https://github.com/Soul-AILab/SoulX-Podcast
-
HuggingFace: https://huggingface.co/collections/Soul-AILab/soulx-podcast
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
1Panel v2.0.12 版本正式发布,支持添加外部面板、支持设置水印
2025年10月27日,现代化、开源的Linux服务器运维管理面板1Panel正式发布v2.0.12版本。 1Panel v2.0.12版本新增多项功能。多机管理方面,新增了外部面板接入功能,支持在主面板里一并添加1Panel、宝塔等兼容面板,统一查看、管理,让多节点运维更轻松;菜单方面,新增对模块进行拖拽排序功能,用户可以根据个人习惯,自由调整导航结构,打造更加契合自身工作流程的操作体验;系统方面,文件与多媒体管理能力迎来升级,新增图片与视频格式转换功能,支持常见格式的一键互转,并且支持设置图片水印,用户可以灵活自定义水印的样式与位置,满足用户的个性化与版权保护需求。 除此以外,1Panel v2.0.12版本还根据社区反馈进行了数十项功能优化与问题修复,涵盖系统性能、界面交互、监控展示等方面,使得1Panel的整体稳定性与易用性进一步提升。 感谢广大社区用户的持续反馈与支持,1Panel期待与您携手,共同打造更加高效、安全、智能的Linux运维新体验。 亮点更新 ■ 支持添加外部面板(X-Pack) 1Panel v2.0.12版本新增了外部面板接入功能,用户可在当前1Panel面...
-
下一篇
2 万美元买个“家务替身”?OpenAI 投资的 1X Neo 人形机器人预售
由OpenAI创业基金领投的挪威机器人公司1X正式开启其首款家用人形机器人Neo的全球预售,售价2万美元(约合14.2万元人民币),并同步推出每月499美元的订阅服务。这款身高1.68米、重30公斤的机器人,号称全球首款专为家庭场景设计的人形助手,目标直指洗碗、整理、浇花等日常琐事,试图将人类从家务中彻底解放。 1X Neo具备基础家务执行能力:用户通过语音或手机App下达指令,它即可完成清理洗碗机、归置物品、照料绿植等任务。单次充电可连续工作4小时,内置摄像头支持远程视角查看,满足用户随时“监工”需求。 然而,面对复杂或非常规场景,Neo的AI尚不足以独立应对。为此,1X创新性推出“专家模式”——当机器人遇到困难时,经用户授权,后台远程操作员将通过VR头显接入,实时接管控制,协助完成任务。这意味着,Neo并非完全自主,而是AI与人类专家协同作业的混合智能体。 这一远程操控机制也引发用户对隐私的担忧。对此,1X明确承诺: 远程操作员无法看到家庭成员人脸或身份信息,视频流经AI实时模糊处理; 用户可设置禁入区域(如卧室、书房),机器人不得进入; 所有远程介入必须经用户主动授权,且操作全程...
相关文章
文章评论
共有0条评论来说两句吧...



微信收款码
支付宝收款码