显著超越流行长短时记忆网络，阿里提出DFSMN语音识别声学模型-低调大师

显著超越流行长短时记忆网络，阿里提出DFSMN语音识别声学模型

2018-03-15 671

在语音顶会ICASSP，阿里巴巴语音交互智能团队的poster论文提出一种改进的前馈序列记忆神经网络结构，称之为深层前馈序列记忆神经网络（DFSMN）。研究人员进一步将深层前馈序列记忆神经网络和低帧率（LFR）技术相结合，构建LFR-DFSMN语音识别声学模型。

该模型在大词汇量的英文识别和中文识别任务上都可以取得相比于目前最流行的基于长短时记忆单元的双向循环神经网络（BLSTM）的识别系统显著的性能提升。而且LFR-DFSMN在训练速度，模型参数量，解码速度，而且模型的延时上相比于BLSTM都具有明显的优势。

研究背景

近年来, 深度神经网络成为了大词汇量连续语音识别系统中的主流声学模型。由于语音信号具有很强的长时相关性，因而目前普遍流行的是使用具有长时相关建模的能力的循环神经网络（RNN），例如LSTM以及其变形结构。循环神经网络虽

微信关注我们

原文链接：https://yq.aliyun.com/articles/544953

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

学习算法你必须知道的一些基础知识（文末福利）

点击标题下「异步社区」可快速关注机器学习是解决很多文本任务的基本工具，本文自然会花不少篇幅来介绍机器学习。要想搞明白什么是机器学习，一定要知道一些概率论和信息论的基本知识，本文就简单回顾一下这些知识。 1.1　概率论概率就是描述一个事件发生的可能性。我们生活中绝大多数事件都是不确定的，每一件事情的发生都有一定的概率（确定的事件就是其概率为100%而已）。天气预报说明天有雨，那么它也只是说明天下雨的概率很大。再比如掷骰子，我把一个骰子掷出去，问某一个面朝上的概率是多少？在骰子没有做任何手脚的情况下，直觉告诉你任何一个面朝上的概率都是1/6，如果你只掷几次，是很难得出这个结论的，但是如果你掷上1万次或更多，那么必然可以得出任何一个面朝上的概率都是1/6的结论。这就是大数定理：当试验次数（样本）足够多的时候，事件出现的频率无限接近于该事件真实发生的概率。假如我们用概率函数来表示随机变量x∈X的概率分布，那么就要满足如下两个特性联合概率p(x,y)表示两个事件共同发生的概率。假如这两个事件相互独立，那么就有联合概率p(x,y) =p(x)p(y)。条件概率p(y | x)是指在已知事...

2018-03-16

499

机器学习、自然语言处理(NLP)和认知搜索技术正以高速率被采用，这并不稀奇。随着组织努力创造价值，增强客户体验，遵守严格的规定并使自己与竞争对手区分开来时，他们对知识型员工提出了非同寻常的要求。通常，他们需要的数据和知识是孤立的，分割的和断裂的。很难在正确的时间显示正确的信息并发现数据中的复杂模式。一个精心设计的NLP、机器学习和搜索技术的结合，使这些组织能够以前所未有的方式迎接挑战并利用企业数据。这种技术有效地推动了一种新的信息获取方式，它比以往任何时候都更快、更准确、更有思想。成功通过后，企业将获得真正的信息驱动，从而优化每个员工和客户体验。这一转变正在迅速成为新的竞争优势，因为它重新定义了专业人士、企业和行业的运作方式——但企业如何成功采用这些技术？ 1.结合用户目标为了推动这些类型的技术的采用，实现必须与每个用户的个人需求保

2018-03-17

622

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。