字节发布端到端同声传译模型 Seed LiveInterpret 2.0
字节跳动 Seed 团队宣布正式推出端到端同声传译模型 Seed LiveInterpret 2.0 —— 首个延迟&准确率接近人类水平的产品级中英语音同传系统,在中英同传翻译质量达到业界SOTA的同时,实现了极低的语音延迟水平。
公告称,Seed LiveInterpret 2.0 基于全双工端到端语音生成理解框架,支持中英互译,可实时处理多人语音输入,像人类同传译员一样以极低的延迟 “边听边说”,一边接收源语言语音输入,一边直接输出目标语言的翻译语音。同时,Seed LiveInterpret 2.0 还支持 0 样本声音复刻,让沟通更加流畅自然。
在测试中,Seed LiveInterpret 2.0 面对 40 秒的大段中文表达,能够低延迟地丝滑输出同款音色的英语翻译。Seed LiveInterpret 2.0 还能快速学习音色,即便此前未“听”过角色的声音,依然能通过实时交互进行现场演绎。
相比传统机器同传系统,Seed LiveInterpret 2.0 模型具备以下优势:
- 接近真人同传的翻译准确率
精准的语音理解能力保障了翻译准确度,在多人会议等复杂场景中英双向翻译准确率超 70%,单人演讲翻译准确率超 80%,接近真人专业同传水平。
- 极低延迟的 “边听边说” 能力
采用全双工语音理解生成框架,翻译延迟可低至 2-3 秒,较传统机器同传系统降低超 60%,实现了真正的 “边听边说” 翻译。
- 零样本声音复刻,音色真实自然
只需采样实时语音信号,便能提取声音特征,用说话人的音色特质实时 “说出” 外语,提升交流的沉浸感和亲和力。
- 智能平衡翻译质量、延迟和语音输出节奏
可根据语音清晰度、流畅度、复杂程度,调整输出节奏,并适配不同语言特性。面对超长信息,依然能保证传译语音节奏的自然流畅。
目前,Seed LiveInterpret 2.0 技术报告已公布,模型基于火山引擎对外开放。此外,Ola Friend 耳机也将在 8 月底接入 Seed LiveInterpret 2.0,成为首个支持该模型的智能硬件设备。
评测结果显示,在语音到文本的同传任务中,Seed LiveInterpret 2.0 中英互译平均翻译质量的人类评分达到 74.8(满分 100,评估译文准确率),较排名第二的基准系统(47.3 分)超出 58%。
在语音到语音中英同传任务中,仅 3 个测评的翻译系统支持该能力,其中 Seed LiveInterpret 2.0 中英互译平均翻译质量达到 66.3 分(满分 100,除评估译文准确率,还评估语音输出时延、语速、发音、流畅性等指标),远超其他基准系统,达到接近专业真人同传的水平。同时,大部分基准系统也不支持声音复刻功能。
在延迟表现上,Seed LiveInterpret 2.0 在语音到文本场景中,输出首字平均延迟仅 2.21 秒,在语音到语音场景中,输出延时仅 2.53 秒,做到了对翻译质量以及时延的均衡。
不过,字节方面也坦承尽管 Seed LiveInterpret 2.0 已初步展现出一定优势,其边界仍有拓展空间。比如,在语言覆盖方面,目前模型主要支持中英互译,其他语种尚未较好支持。此外,其声音复刻的稳定性、语音表现力、情绪复刻能力、极复杂情况下的翻译准确性等仍有进步空间。
更多详情可查看官方公告。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
智能体时代,如何避免大厂垄断 AI ?
“过去十几年里,互联网的开放性正在逐步消失。越来越多的服务、数据、用户,被锁定在几个大型平台的生态里。协议的边界被平台所取代,数据也变成了平台资产而不是网络资源。我们不希望智能体时代重复这一切。” 近日,ANP 开源技术社区发起人常高伟在接受国际著名科学杂志《New Scientist》采访时指出了当前互联网的封闭性,并担心智能体时代将会重蹈覆辙。 目前来看,大部分 AI 协议都是由大型科技公司提出的,比如 Anthropic、Google 这些企业,他们推动了 MCP、A2A 等协议的发展,也让更多的人看到协议对智能体的价值。但这些协议的设计,很多时候是基于他们自己的产品路径和商业利益出发的。 常高伟认为,这本身没有错——商业公司有自己的考量和节奏。“但问题是,如果整个智能体互联网的底层协议都由几家公司来主导,那我们可能会再次走上平台封闭化的老路。就像今天的社交平台、应用商店、广告系统,数据和权限越来越集中在少数大公司手里。” 要打破这种封闭性困局,常高伟等人于 2024 年 4 月开源的 ANP(Agent Network Protocol) 提供了新路径。与 Anthropic ...
- 下一篇
预计 2029 年中国数据仓库软件市场规模将达 20.9 亿美元
国际数据公司(IDC)于近日发布了《2024年下半年中国数据仓库软件市场跟踪报告》。IDC 数据显示,2024下半年中国数据仓库软件市场规模为5.5亿美元,同比增长8.7%。 其中,本地部署数据仓库软件规模2.8亿美元,同比增长6.8%;公有云数据仓库软件规模2.6亿美元,同比增长10.9%。IDC预测, 到2029年,中国数据仓库软件市场规模将达到20.9亿美元,2024-2029的5年市场年复合增长率(CAGR)为15.5%。 2024下半年,中国数据仓库本地部署模式市场前五大厂商总计占比57.7%。出于数据安全和合规性的考虑,金融、政府、能源等行业,以及大型企更倾向于本地部署模式的数据仓库产品。 与本地部署市场相比,公有云数据仓库服务的市场集中度更高,2024下半年,前五大厂商份额共计达到90.2%。随着中国泛互联网行业和传统企业的互联网业务的快速发展,企业已经在公有云上积累了大量的数据,为云上数仓的使用创造了前提和基础。2024年,公有云数据仓库市场规模已超过本地部署市场,占比50.3%。 IDC中国企业软件市场研究经理王楠表示,存算分离架构、实时分析能力以及湖仓一体技术已经成...
相关文章
文章评论
共有0条评论来说两句吧...