基于深度前馈序列记忆网络,如何将语音合成速度提升四倍?
研究背景
语音合成系统主要分为两类,拼接合成系统和参数合成系统。其中参数合成系统在引入了神经网络作为模型之后,合成质量和自然度都获得了长足的进步。另一方面,物联网设备(例如智能音箱和智能电视)的大量普及也对在设备上部署的参数合成系统提出了计算资源的限制和实时率的要求。本工作引入的深度前馈序列记忆网络可以在保持合成质量的同时,有效降低计算量,提高合成速度。
我们使用基于双向长短时记忆单元(BLSTM)的统计参数语音合成系统作为基线系统。与其他现代统计参数语音合成系统相似,我们提出的基于深度前馈序列记忆网络(DFSMN)的统计参数语音合成系统也是由3个主要部分组成,声音合成器(vocoder),前端模块和后端模块,如上图所示。我们使用开源工具WORLD作为我们的声音合成器,用来在模型训练时从原始语音波形中提取频谱信息、基频的对数、频带周期
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
阿里云MVP项目武汉战略升级,携手司机宝开拓合作新纪元
在国家大力倡导科技兴国、网络强国的背景下,武汉市启动了“3551人才计划”、“资智聚汉”和“人才战略”等多项重大举措,为多渠道引进人才,留住人才做了大量卓有成效的工作。作为武汉市互联网行业的重要一员,司机宝积极响应国家和市政府的工作指引,利用其在国内互联网行业的强大影响力,联合阿里云MVP——阿里云最有价值的专家一起,成立“阿里云MVP武汉同城会联盟”。 2018年10月27日下午,由武汉市大数据协会主办,司机宝承办主题为“阿里云MVP项目武汉战略升级,携手司机宝开拓合作新纪元”阿里云MVP武汉城市合作伙伴签约授牌仪式成功举办。湖北省经济和信息化委员会软件处曾旷怡处长,武汉市信息中心王留军主任、武汉市互联网信息办公室信息产业处谌斌处长、张成利科长,武汉市软件行业协会、武汉市大数据协会温晖秘书长、吴剑文副秘书长等嘉宾与阿里云MVP项目
- 下一篇
车联网也需要“走对路”,用户需求“导航”小度车载OS持续领先
车联网在无人驾驶浪潮下越来越成为新科技热门领域,百度小度车载OS、阿里斑马智行、腾讯“AI in Car”等大佬级产品纷纷入局,车载OS的竞争也越来越激烈。 这其中,在无人驾驶上最为积极的百度动作频频,其小度车载OS在今年7月发布以来不断迭代,此次11月1日百度世界大会上又宣布进行了“全新升级”。 在AI这个赛道上,由于某种默认的、且被中央部委定位过的分工,百度通过Apollo等占据了无人驾驶“超级席位”,但车联网却并未“划界”,围绕车联网的竞争,在包括BAT在内的互联网科技大佬的加入过程中,逐渐白热化。 目前来看,随着奇瑞、现代、起亚等合作伙伴推出车联网产品,小度车载OS已经成为业内最快落地的平台,而从行业角度审视百度的种种做法,小度的领先可能并不意外。 车联网首先要具备这两大基础能力 车联网并不是一个全新的技术领域,某种程度上它是过去的技术和资源在汽车场景的全新应用,因此,像小度车载OS这类产品,谁能领先,首先看的无非是背后平台的“基础能力”。 技术:四大新潮技术必须齐备 很少有技术领域像车联网一样,对几乎所有的新技术有种完备而苛刻的要求,它需要人工智能来支持智能化的人车交互,需要...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- 设置Eclipse缩进为4个空格,增强代码规范
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS7设置SWAP分区,小内存服务器的救世主
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Mario游戏-低调大师作品
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2更换Tomcat为Jetty,小型站点的福音