脱离现实场景去空谈“识别准确率”都是耍流氓
“对真正做技术的人来说,一项技术最有意思的不是它什么时候能work,而是它什么时候不work。最近我们经常从媒体上看到‘语音识别准确率97%、98%、甚至99%’这样误导性的标题党,但要知道这样夸张的准确率只可能在非常受限的场景下获得。不信就请走进一个正进行着热烈讨论的会议室,掏出手机放桌上,打开语音输入法做个会议记录吧。这样日常真实场景下的语音识别准确率,别说97%,断断续续勉强看懂就不错了。在众多真正有意义的场景下,语音识别的准确率远没有标题上宣传的那么高,脱离现实场景去谈准确率统统都是耍流氓。我认为语音行业的“圈内人”应该更严肃的去思考,我们这个行业的工作在学术研究上到底在哪些方面取得了实质性的进展,在工业应用上到底在哪些方面实实在在的帮助到大众,在商业模式上到底在哪些方面有所创新。“如果问到业界目前热衷于讨论的“识别准确