您现在的位置是：首页 > 文章详情

中国电信发布首个支持 30 种方言混说语音大模型

日期：2024-05-26点击：237收藏

中国电信人工智能研究院（TeleAI）于近日发布了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型，可同时识别理解粤语、上海话、四川话、温州话等30多种方言，是目前国内支持最多方言的语音识别大模型。

据悉，中国电信人工智能研究院已构建超30种、超30万小时的高质量方言数据库，研发团队采用的“蒸馏+膨胀”联合训练算法可解决超大规模多场景数据集和大规模参数条件下预训练坍缩的问题，实现1B参数80层模型稳定训练。

中国电信方面表示，星辰语音大模型是业内首个开源的、基于离散语音表征的语音识别大模型，通过“从语音到token再到文本”的建模新范式，将推理时语音传输比特率大幅降低。

据中国电信方面透露，星辰语音大模型现已对外开源及应用落地，在福建、江西、广西、北京、内蒙古等地的中国电信万号智能客服试点应用。通过接入星辰大模型，智能客服能够迅速理解30种方言，日均处理电话量达到约200万通，极大地提高了服务效率和用户体验。

关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有，本站原创内容转载请注明来源。

Java分享