您现在的位置是:首页 > 文章详情

火山引擎发布豆包语音模型2.0,实现语义与情感双突破

日期:2025-10-16点击:4

火山引擎正式推出豆包语音合成模型2.0(Doubao-Seed-TTS 2.0)与声音复刻模型2.0(Doubao-Seed-ICL 2.0),依托豆包大语言模型全新架构,实现语音从“文本朗读”到“理解式情感表达”的跨越。

此次升级核心在于深度语义与上下文理解能力的突破。语音合成模型可覆盖多轮对话语境,精准呈现语气、停顿与情绪变化,支持语速、声线等指令的精细化控制;声音复刻模型在秒级还原声线基础上,新增情感演绎能力,可适配小说配音、对话交互等多场景。

针对教育场景专项优化后,模型对小初高全学科复杂公式符号的朗读准确率达90%,远超行业平均水平。目前两款模型已上线火山引擎语音控台,服务OPPO、洋葱学园等客户,覆盖对话助手、教育辅助等多元场景。

原文链接:https://www.oschina.net/news/377819
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章