网易有道 ASR 团队斩获 Interspeech 2021 算法竞赛两项冠军
在近期举行的Interspeech 2021会议上,主办方开展了“非母语儿童语音识别”的特别会议,并发布专项数据集用于算法评测竞赛,旨在推动非母语儿童语音识别技术的研究。此次竞赛共分为4个细分赛道,网易有道ASR团队斩获其中2项冠军与1项亚军。
Interspeech是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的顶级旗舰国际会议,作为全球最大的综合性语音信号处理领域的科技盛会,历届Interspeech会议都备受全球各地语音语言领域人士的广泛关注
当前,自动语音识别(ASR)技术已经在很多场景中得到实际应用,但当应用于特定类型的人群(例如非母语人群和儿童等)的语音数据时,效果仍有较大的可提升空间。
非母语语音中,几种现象会大大降低传统ASR的性能,包括发音错误的单词、不合语法的发音等;儿童语音则由于生理差异(例如较短的声道长度)、认知差异(例如语言习得)和行为差异(例如习惯性低语)等因素,使得其更具挑战。目前也缺乏针对非母语和儿童语音的公开数据库。
虽然面临诸多挑战,但在实际应用中,很多语音数据均来自于非母语人士和儿童,例如语言学习等常见场景。研究针对这两类人群的ASR技术,具有非常大的意义和价值。
网易有道 ASR 团队凭借自身的AI技术能力,结合在线教育真实场景中的多年深耕实践,在此次“Interspeech 2021-非母语儿童语音识别”算法竞赛中取得2项冠军、1项亚军的优异成绩:在英文指定数据集和开放数据集两个赛道中,网易有道均以识别准确率更高获得冠军,并在德语指定数据集赛道中获得第二名。
网易有道ASR团队采用了速度扰动、音量扰动、基频扰动等多种数据增强方法以扩增数据量,减小不同语音音量差异,同时平衡不同年龄段儿童语音数据的基频变化。模型方面采用了传统 Hybrid-NN 模型和端到端 Transformer 模型。其中端到端模型还采用成人数据进行模型预训练,以帮助构建儿童语音识别单元以及训练声学模型。
目前,语音识别技术已经广泛应用于网易有道的众多产品中,如有道词典、有道精品课、有道少儿英语、有道词典笔等,开拓了明星语音、词典笔跟读绘本、语音答题等实际场景中的功能,给用户带来更加便捷、有趣的体验。
未来,网易有道将继续推进语音识别等AI技术的研究,结合在线教育真实场景与用户需求,不断用先进技术提升产品体验,为用户带来更大价值。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Antrea 加入 CNCF 沙箱
今天,我们很高兴地宣布,CNCF TOC 已经接受 Antrea 作为沙箱项目。这对于刚刚发布 1.0 版本的 Project Antrea 来说是一个重要的里程碑。我们非常荣幸能加入其他项目的行列,如 Cloud Native Buildpacks、Contour、Harbor 等。通过将 Antrea 捐赠给 CNCF,我们希望它能提高该项目的知名度,帮助带来新的贡献者,并促进与 CNCF 托管的其他项目的协同作用。 最初发布于 2019 年 11 月,Antrea 实现了容器网络接口(Container Network Interface,CNI)和 Kubernetes 网络策略,用于 Kubernetes 集群的任何地方运行。它构建在 Open vSwitch(OVS)上,Open vSwitch 是针对分布式、多层交换性能进行优化的开源技术。由于 OVS 中的高度可扩展架构,Project Antrea 快速添加了新功能,同时获得了来自用户和合作伙伴社区的贡献和互操作性支持。 如果没有社区通过问题、拉请求、讨论、代码、文档和许多其他贡献的参与,Antrea 根本不会有今天的...
- 下一篇
5 月 20 日,GaussDB 将有大事发生
摘要:5月20日,华为云TechWave云原生2.0专题将线上举行,更多云原生创新技术和丰富实践还将与大家见面,GaussDB也将再次迎来升级亮相! 本文分享自华为云社区《华为云TechWave云原生2.0专题日即将举行,GaussDB再次升级亮相》,原文作者:心机胖。 数据是企业数字化转型的核心之一,并成为智能时代新的生产资料和企业数字化的生命,而数据库则是支撑数据生命线的底座。数据库从作为一个信息系统服务的支撑软件,已经转变为通过数据库云化来加速实现企业数字化转型,数据库的持续发展也进入了云原生数据库新阶段,基于统一云基础设施的云原生数据库,将成为企业数字化转型的数据底座。 在刚刚结束不久的华为开发者大会 2021(Cloud)上,华为云CTO张宇昕宣布了云原生金融级分布式数据库GaussDB(for openGauss)正式商用,并表示“数据库是承载企业核心交易业务与数据处理的核心基石,云原生数据库需要承载核心业务的高性能,具备弹性扩展、快速发放、高可用、数据安全等能力。” 华为云GaussDB是数据库团队基于对内外部客户高可靠、高性能诉求的理解,结合云原生与AI技术倾力打造的数...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Red5直播服务器,属于Java语言的直播服务器
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- 2048小游戏-低调大师作品
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS关闭SELinux安全模块
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池