《自然》 脑机接口新突破 人脑信号转文本准确率达97%
云栖号资讯:【点击查看更多行业资讯】
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!
据国外媒体报道,一个由加州大学旧金山分校的研究团队打造的新型人工智能系统可根据人脑信号来生成文本,准确率最高可达97%。
亚马逊和谷歌等科技公司打造的虚拟助手相当先进,语音识别能力比起几年前进步惊人,近年来人们才刚开始领会它们的威力。
然而,事实上,一项更令人惊叹、更匪夷所思的里程碑式技术创新可能即将实现。它的出现让语音识别技术完全相形见绌,这是一个十分强大的人工智能(AI)系统,可以根据人们的大脑活动直接生成完整的文本,整个过程完全不需要听到任何一个单词。
这不完全是科幻小说中的概念。近几十年来,从动物模型到人类参与者,脑机接口技术的发展可谓突飞猛进。事实上,这类技术已经在尝试将这种概念从幻想变成现实。
加州大学旧金山分校的研究人员在一项新研究中解释说,目前来看,通过该技术将人脑信号转换成的文本结果还不很准确。
为了探究是否能够改善这一状况,由加州大学旧金山分校Edward Chang实验室神经外科教授Edward Chang领导的一个团队使用了一种全新的方法来解码脑皮质电图:通过植入大脑的电极,来获取皮质活动中所产生的电脉冲记录。
在这项研究中,四名癫痫患者使用了这种植入物,以便监测他们的身体状况引起的癫痫发作情况。研究团队还进行了一项附带实验:让参与者大声、反复地朗读一些预先准备的句子,同时通过电极来记录他们在此期间的大脑活动。
然后,这些数据被输入到一个神经网络,该网络根据实验的音频记录,分析出与特定语音特征(如元音、辅音或口型)相对应的大脑活动模式。
之后,另一个神经网络对这些大脑表现进行解码——参与者反复朗读30到50个句子时产生的大脑活动数据——并据此来尝试预测人们所说的话,预测根据他们朗读单词时所产生的皮层信号来进行。
在最好的情况下,该系统在将其中一名参与者的大脑信号转化成文本时,词错率(WER)只有3%——至少在这些严格限定的实验条件下,这个词错率也许已经接近于迄今为止人工智能读取人的想法的最佳表现。
在研究论文中,研究团队详细列举了许多参与者所朗读的参照句子的例子,以及神经网络所生成的“预测”。那些预测有时是错误的,但也不总是出错。然而,从那些非常明显的错误来看,它们似乎与人耳听语音时会犯的错误大不一样(这可能是人工智能引入的数据集有限所致)。
神经网络出错的例子包括:“这家博物馆每天晚上都聘请音乐家过来”,被预测为“这家博物馆每个昂贵的早晨都聘请音乐家过来”;“蛋糕的一部分被狗吃掉了”,被预测为“蛋糕的一部分是饼干”;“蒂娜·特纳是一位流行歌手”,被预测被“迪德·特纳是一位流行歌手”。
在最糟糕的例子中,神经网络的错误完全莫名其妙,不管是在语音上还是在语义上,都与实际的句子完全搭不着边:“她穿着温暖的羊毛工装裤”被预测为“绿洲是海市蜃楼”。
然而,研究团队称,尽管这些显而易见的错误有些诡异,但总的来说,该系统也许还是刷新了基于AI的大脑活动解码的最佳表现,毕竟它表现最好时的词错率只有5%,能够与专业的人工语音转录相提并论。
当然,要应付日常发言的专业转录员必须得有数以万计的词汇量。相比之下,这个系统只能从有限的短句中学习到大约250个单词的皮层特征,所以拿二者相比较并不公平。
虽然还有许多障碍需要克服,但研究团伙认为,该系统有朝一日可能会让那些失去说话能力的人能够重新“开口”说话。如果这样的事情成为可能,会有望产生巨大的影响——为一些人提供一种与周围世界交流的方式——而且所带来的影响可能会远远超出人们目前的想象。
研究论文的作者解释说,“在长期植入的参与者中,可用的训练数据量将比本研究中使用的半小时左右的语音量大几个数量级,这意味着输入语言的词汇量和表达灵活性会大大提高。”
该研究的结果发表在《自然神经科学》杂志上。(乐邦)
【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/zhibo立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK
原文发布时间:2020-04-23
本文作者:人工智能学家
本文来自:“人工智能学家 微信公众号”,了解相关信息可以关注“人工智能学家”
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
如何评估一项技术是否值得长期投入
“每个人的时间都是有限的,在有限的时间里选择一项值得投入的技术会变得尤为重要。” 笔者从 2008 年开始工作到现在也有 12 个年头了,一路走来都在和数据打交道,做过很多大数据底层框架内核的开发(Hadoop,Pig,Hive,Tez,Spark),也做过多年上层数据计算框架(Livy, Zeppelin)以及数据应用开发,包括数据处理,数据分析以及机器学习。现在是 Apache Member 以及多个 Apache 项目的 PMC 。2018 年加入阿里巴巴实时计算团队专注在 Flink 的研发。 今天我想结合自己过去的职业经历来聊聊如何评估一项技术是否值得学习。我一直在大数据这个圈子,从最初的 Hadoop 到后来的 Hadoop 生态项目 Pig,Hive,Tez,然后又到新一代的计算引擎 Spark ,再到最近在做的 Flink ,大数据计算引擎贯穿我的整个职业生涯。我个人来说是比较幸运的,在每个阶段都在做比较火的技术,当时更多的是凭着自己的兴趣和直觉在选择技术类型。现在回过头来看我觉得需要从下面 3 个大的纬度来评估一项技术是否值得学习。 1、技术深度2、生态广度3、进化能...
- 下一篇
Redis 10亿数据量只需要100MB内存,为什么这么牛?
云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 本文主要和大家分享一下redis的高级特性:bit位操作。本文redis试验代码基于如下环境:操作系统:Mac OS 64位版本:Redis 5.0.7 64 bit运行模式:standalone mode redis位操作 reids位操作也叫位数组操作、bitmap,它提供了SETBIT、GETBIT、BITCOUNT、BITTOP四个命令用于操作二进制位数组。先来看一波基本操作示例: SETBIT语法:SETBIT key offset value即:命令 key 偏移量 0/1setbit命令用于写入位数组指定偏移量的二进制位设置值,偏移量从0开始计数,且只允许写入1或者0,如果写入非0和1的值则写入失败: GETBIT语法:GETBIT key offset即:命令 key 偏移量gitbit命令用于获取位数组指定偏移量上的二进制值: BITCOUNT语法:BITCOUNT key即:命令 keybitcount命令用于获取指定key的位数组中值为1的二进制位的数量,之前我们写...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS关闭SELinux安全模块
- CentOS7设置SWAP分区,小内存服务器的救世主
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作