重磅!阿里开源自研语音识别模型DFSMN,准确率高达96.04%
阿里开源语音识别模型DFSMN
在近期举行的云栖大会武汉峰会上,装有DFSMN语音识别模型的“AI收银员”在与真人店员的PK中,在嘈杂环境下准确识别了用户的语音点单,在短短49秒内点了34杯咖啡。此外,装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。
著名语音识别专家,西北工业大学教授谢磊表示:“阿里此次开源的DFSMN模型,在语音识别准确率上的稳定提升是突破性的,是近年来深度学习在语音识别领域最具代表性的成果之一,对全球学术界和AI技术应用都有巨大影响。”
图:阿里在GitHub平台上开源了自主研发的DFSMN语音识别模型
语音识别声学模型
语音识别技术一直都是人机交互技术的重要组成部分。有了语音识别技术,机器就可以像人类一样听懂说话,进而能够思考、理解和反馈。
近几年随着深度学习技术的使用,基于深度神经网络的语音识别系统性能获得了
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
yolo3(目标检测)实测
yolo是继faster-r-cnn后,原作者在目标检测领域进行的新研究。到了v3版本以后,虽然已经换人支持,但是更注重工程实践,在实际使用过程中突出感受就是 “非常快”,GPU加速以后能够达到实时多目标,并且已经完成了工程实践。下一步需要做的,应该就是 1、小型化 2、fpga化 3、垂直领域特定目标检测 这里我对一个电影的片段进行了实验,应该说图像质量很差,但是实现效果很好 。 来自为知笔记(Wiz) 目前方向:图像拼接融合、图像识别 联系方式:jsxyhelu@foxmail.com
- 下一篇
6月8日云栖精选夜读丨阿里云宣布与国内规模最大的汽车企业上汽集团合作
云栖大会·上海峰会,6月7日,阿里云宣布与国内规模最大的汽车企业上汽集团合作,上线业内首个混合云汽车研发仿真计算服务平台——上汽仿真计算云SSCC(SAIC Simulation Computing Cloud)。从2014年开始合作,2016年合作发布全球首款量产互联网汽车荣威RX5至今,上汽集团旗下自主品牌包括荣威、名爵、大通等新车全线搭载基于AliOS操作系统的斑马智行,装车量已突破60万辆。未来双方也将继续深入合作,从端到云全面拓展合作。 热点热议 阿里云宣布与国内规模最大的汽车企业上汽集团合作 作者:云上未来发表在:雷锋网 小试Kubeflow系列:阿里云上使用JupyterHub 作者:必嘫 发表在: Docker&Kubernetes容器服务 重磅!阿里开源自研语音识别模型DFSMN,准确率高达96.04% 作者: 技术小能手 发表在: 阿里技术 知识整理 Kaggle 20G数据集强势分析“绝地求生”,科学吃鸡攻略拿走不谢! 作者: 技术小能手 DeepMind论文解读:让机器更深入地理解文本 作者: 技术小能手 发表在: PaperWeekly 最好的 Lin...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8编译安装MySQL8.0.19
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Mario游戏-低调大师作品
- 2048小游戏-低调大师作品
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2整合Thymeleaf,官方推荐html解决方案