语音对话平台海尔五代智能电视落地
智能语音交互(Intelligent Speech Interaction)是AI的入口,智能语音交互之于VUI,正如鼠标键盘之于GUI。但什么是智能语音交互呢?这个名词并非每位同学都能望文生义,我试着给出个最简练的解释:让机器能听懂我们的话,并能给出相应的反馈。
这其中包括了唤醒、声纹、语音识别(ASR)、语义理解(NLU)、知识库(QAS)、多轮对话(Dialog)、语音合成(TTS)等诸多端上和云上的能力,这前面还包括了从麦克风整列、声学信号处理到端上唤醒、免唤醒等能力。
为什么会有这篇的分享呢?
先来听听"一小撮"客户的声音:A公司有ASR,B公司有NLU,C公司有TTS,他们看起来都不错,我都想用,我来把这些攒起来,然后根据具体情况,选择ASR用A家还是阿里的、NLU用B家还是你们的……端上呢,向我的服务发起请求,我来做上帝。