首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/219783

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

中国人工智能学会通讯——智能语音技术与产业应用展望 1.1 智能语音技术的发展现状和挑战

摘要: 本文结合云知声过去5年在智能语音技术产业化的实践经验,对智能语音技术及其产业应用的现状、挑战和发展趋势作一个分析和展望。智能语音技术是人工智能技术的一个重要分支,研究如何利用机器实现人类自然语言的“听”和“说”能力。随着2006 年深度学习技术的兴起,以及移动互联网的大数据积累,语音在降噪、识别、理解、合成等技术方面都取得了突破性进展,进入了产业化阶段。与此同时,物联网智能终端的高速发展,也为智能语音技术提供了一个广阔的产业应用舞台。 1.1 智能语音技术的发展现状和挑战 智能语音技术经过几十年的发展和积累,经历了模板匹配、统计方法和深度学习方法阶段。在模板匹配和统计学习阶段,主要是根据发音机理和听感特性,设计语音特征提取和归一化方法,根据特征距离或分布概率计算语音的帧级匹配度,结合动态规划算法搜索最优序列。在深度学习阶段,特征提取和帧级匹配度计算统一用深度神经网路( DNN) 建模,极大地提高了建模精确度。目前,智能语音技术已经形成了相对完备的技术体系,如图1所示,主要包含5个方面。 (1)语音降噪与增强技术。解决复杂真实场景下的语音回声消除、语音测向、波束形成、去混响、分离...

中国人工智能学会通讯——智能语音技术与产业应用展望 1.2 智能语音产业应用的现状和挑战

1.2 智能语音产业应用的现状和挑战 智能语音产业应用,基本上都是从语音控制、语音识别和语音交互作为切入点建立起来的,根据不同的定位和形态,目前主要分为以下4类。 (1)APP类纯软语音应用。如Apple Siri和Microsoft Cortana等,在手机、平板或PC上以软件方式解决操作和聊天等问题,内置各种搜索、问答和对话服务。 (2)软硬一体的语音交互应用。如智能音箱Amazon Echo、智能电视、智能语音空调等应用,语音成为主要交互手段,实现控制和相关内容服务获取。 (3)垂直领域的语音转写应用。如医疗语音病例录入、法律语音转写、语音客服数据分析等,将语音数据进行实时或离线转录,后期做结构化分析。 (4)基于语音识别的口语评测等应用。对用户口语语音进行发音、流利度、韵律等评估,并检测口语发音、语法等错误,帮助用户提升口语水平。 智能语音产业应用,目前还面临着用户普及率、认可度和活跃度不够高的问题,原因是多样的,这些挑战主要包括下面4个方面。 (1)基础技术需要继续改进和完善。特别是复杂应用场景、噪声、口音和专业领域的语音识别稳定性和适应性,是扩大实用范围的关键,更多的是针对...

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

JDK

JDK

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。