IBM对决微软:“人类对等”级别的语音识别精度纪录再次易手
人工智能虽然能够在众多层面实现远超人类的处理能力,但语音识别显然尚不在其中——至少目前尚不在其中。IBM公司在最近的语音识别测试当中已经正式超越微软,并将词汇错误率控制在5.5%水平。
尽管已经拿下最新世界纪录,但IBM公司表示要让机器拥有超越人类的对话内容理解能力,恐怕还需要再等待一段时间。
IBM对决微软:“人类对等”级别语音识别精度纪录再次易手
IBM公司在最近的语音识别测试当中已经正式超越微软,并将词汇错误率控制在5.5%水平。
这样的错误率基本相当于人们在聆听对话时,每听到20个词汇而误解其中1个。这样的比例亦使得IBM公司顺利击败去年10月微软公司最新拿出的5.9%测试错误率结果,并成功超越了IBM自身在2016年创造的6.9%成绩。
不过IBM公司强调称,要让机器拥有超越人类的对话内容理解能力,恐怕还需要再等待一段时间。微软方面认为,其上一次公布5.9%的词汇错误率时,其语音识别方案已经达到了“人类对等”的水平。不过IBM公司则泼下冷水,表示其最新研究证明微软的庆祝还为时过早。
正因为如此,IBM公司首席研究科学家GeorgeSaon表示“我们不会为此次成绩开香槟庆祝。”
Saon同时解释称,“在实现此次里程碑式成就的过程当中,我们发现要实现真正的人类对等级别理解能力,则必须要将词汇理解错误率控制在5.1%以下。”
“尽管我们得到的5.5%成绩确实是一项不小的突破,但将人类对等理解级别确定为5.1%证明了我们未来还有很长的道路要走,而在此之后我们并不能贸然表示自己的技术成果已经拥有与人类相同的语音识别能力。”
为了实现这一5.5%的词汇理解错误率,IBM公司将长/短期记忆(简称LSTM)、一套神经网络以及WaveNet语音模型与三套强大的声学模型加以结合。其利用Switchboard语音资料训对这些模型进行了测试,其中甚至包含陌生人之间正式电话交谈的相关语音集合。
IBM公司还建立了一项“打电话回家(CallHome)”测试方案,希望利用其以更具差异及挑战性的对话内容对自身网络的理解能力进行验证。该测试中包含家庭成员间在多种主题之间进行的偶然性聊天,而且这些主题在事先完全无法确定。
IBM公司在这项测试当中获得了10.3%的词汇理解错误率,并发现人类在这一测试中的错误率仅为6.8%。
蓝色巨人在其研究论文当中强调称,Switchboard测试中存在一项数字难题。其指出,“在40名测试对话者当中,有36名曾经出现在训练数据当中,其中部分甚至参与过多达8项不同对话。我们的声学模型非常准确地记住了其在训练期间所处理过的语音模式。”
而之所以在“打电话回家”测试项目中出现较大差距,是因为声学与语言模型并未收录测试中对话者的数据。
IBM公司强调称,其目前正在努力推进语音识别技术的发展速度,旨在以此为基础将更多新功能引入其沃森语音转文本服务当中。
本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
行业报告 丨2017中国人工智能产业图谱
2015年两会,李克强总理为“互联网+”背书,催热了互联网创业。而今年两会,“人工智能”首次被列入政府工作报告,随之而来的是人工智能板块领跑大盘涨势,无疑,这一切将刺激人工智能在多个领域的全面发展。企业数据服务商企名片与华兴逐鹿一起,联合多家专业机构,出品《2017年AI图谱大报告》,一起来探究风口中的人工智能。 本文从以下四个方面解读关于这些人工智能公司的现状: 1、人工智能企业融资盘点 2、人工智能行业图谱 3、人工智能投资机构TOP10 4、二级市场人工智能简报 一、人工智能企业融资解读 ▼ 1.1 2017年AI融资盘点 2017年短短不到三个月的时间,国内AI获投项目已有36个,千万级别融资占据半数以上。其中不乏多家融资过亿企业,融资详情参见下图: ▲ 2017人工智能获投列表 数据来源:企名片 2017.3.8 2017人工智能融资阶段性对比: ▲ 2017人工智能融资阶段分布 数据来源:企名片 2017.3.8 如上图所示,A轮及以上融资比例较高,占总融资笔数的58%,这些人工智能初创公司的主要发展方向也各不相同:新智元属于人工智能资讯平台;深醒科技专注人脸识别技术;推想...
- 下一篇
吴恩达说人工智能永恒的春天已经到来你准备好了吗?
近日吴恩达在斯坦福MSx未来论坛上的演讲,描述他眼中的AI世界。 AndrewNg认为,人工智能(AI)对未来许多行业带来的变革,如同100多年前,美国“触电”一样——电对制造、运输、农业(尤其是冷藏)、医疗等等带来了划时代的变革。AI驱动着搜索和广告,AI也正在彻底改变金融工程,对物流的转变进行了一半,医疗和自动驾驶刚开始,前景巨大。 监督学习 驱动百亿的市场容量的,基本上属于同一种AI:监督学习(Supervisedlearning),即用AI来确定A-->B的映射——输入A和响应B的映射。 路用Email作为输入A,判断是否是垃圾邮件是响应B; 路用图像作为输入,识别这是一千种物体中的哪种; 路从声音A到文字B,从英文到法文,或从文字到声音; 软件可以学习这些输入A到响应B的映射——有很多好的工具来让机器学习。比如50,000小时的音频和对应的文本,就能让机器学到如何从音频内容转化为文本内容。通过大量的电邮数据和区分垃圾的标签,也可以很快地训练出一个垃圾邮件过滤器。 现在的AI还很初级——A到B的映射而已,不过已经推动着很大的市场。百度有很好的算法来预测某用户是否会点击某广...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
-
Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8编译安装MySQL8.0.19
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS6,CentOS7官方镜像安装Oracle11G
- SpringBoot2整合Redis,开启缓存,提高访问速度
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Hadoop3单机部署,实现最简伪集群
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果