语音对话系统的技术突破点在哪?深度解读人机交互的技术核心
雷锋网按:本文来源公众号“极限元”,作者温正棋,极限元技术副总裁、中国科学院自动化研究所副研究员,中科院—极限元“智能交互联合实验室”主任。雷锋网(公众号:雷锋网)授权转载。
语音作为互联网的一种入口方式,正在侵入我们的生活,人机交互的核心——对话系统,对交互的应用至关重要,人脑与机器智能的结合,能够突破现有技术瓶颈吗?这里就有必要重点介绍下人机交互相关的核心技术。
从整个交互系统接入用户的输入信息开始,包括语音、人脸、多模态情感相关的信息,我们在对话系统里面对输入的信息进行理解,通过这个对话部分以后产生输出,最后用文字也可以用语音合成展现出来,这就是整个流程,其中我们关注的最主要的是语音部分以及对话系统部分,其他的多模态今天的分享不会涉及太多。
国内研究语音相关的团队主要包括科研院所、语音技术公司以及互联网公司三部分:
科研院所主要包括
