谷歌开源 AI 可在嘈杂环境中区分声音，准确率达92%-低调大师

谷歌开源 AI 可在嘈杂环境中区分声音，准确率达92%

2018-11-14 748

据 VentureBeat 报道，Google 人工智能研究部门在语音识别方面取得了新的进展，能从嘈杂的环境中分辨声音，准确率高达 92%。Google 人工智能研究部门在一篇名为《Fully Super vised Speaker Diarization》的论文中描述了这一新的 AI 系统，称它“能以一种更有效的方式识别声音”。

这套强大的 AI 系统涉及到 Speaker diarization 任务，需要标注出“谁”从“什么时候”到“什么时候”在说话，将语音样本分割成独特的、同构片段的过程。还能将新的演讲者发音与它以前从未遇到过的语音片段关联起来。

其核心算法已经开源可用。它实现了一个在线二值化错误率(DER)，在NIST SRE 2000 CALLHOME基准上是7.6%，这对于实时应用来说已经足够低了，而谷歌之前使用的方法DER为8.8%。

谷歌研究人员的新方法是通过递归神经网络(RNN)模拟演讲者的嵌入(如词汇和短语的数学表示），递归神经网络是一种机器学习模型，它可以利用内部状态来处理输入序列。每个演讲者都从自己的RNN实例开始，该实例不断更新给定新嵌入的RNN状态，使系统能够学习发言者共享的高级知识。

研究人员在论文中写道:“由于该系统的所有组件都可以在监督环境下学习，所以在有高质量时间标记演讲者标签训练数据的情况下，它比无监督系统更受青睐。我们的系统受到全面监督，能够从带有时间戳的演讲者标签例子中学习。”

在未来的工作中，研究团队计划改进模型，使其能够集成上下文信息来执行脱机解码，他们希望这将进一步减少DER。研究人员还希望能够直接对声学特征进行建模，这样整个Speaker diarization系统就可以进行端到端训练。

来自：网易科技

微信关注我们

原文链接：https://www.oschina.net/news/101780/fully-super-vised-speaker-diarization

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

VMware 收购 Kubernetes 初创公司 Heptio

昨日，VMware 宣布收购由 Kubernetes 的两位联合创始人创立的初创公司 Heptio。此举也被理解为 VMware 有意加强基于容器化的架构和开源生态。值得注意的是，在 VMware 的数十次收购经历中，这似乎是唯一一次针对容器技术的收购，而作为被收购对象的初创公司 Heptio 也不一般。 Heptio 由 Kubernetes 联合创始人 Joe Beda 和 Craig McLuckie 于西雅图共同创立，致力于帮助企业构建和运行基于 Kubernetes 的容器式体系架构。这两位联合创始人在 2014 年时就职于谷歌 Kubernetes 项目团队，在开发 Kubernetes 的过程中发挥了关键作用，他们也被认为是 Kubernetes 核心创始人，在 Kubernetes 社区中一直都很活跃。本次收购预计于2019年第四季度完成，根据协议，Joe Beda、Craig McLuckie 及其团队都将加入 VMware。 Kubernetes 于2014年开源，从此成为管理软件容器的首选工具，并且正在成为企业应用基础设施中越来越重要的一部分。Kubenetes...

2018-11-08

719

近日，浩鲸科技和京东先后宣布正式加入 Linux 基金会旗下 OpenMessaging 开源标准社区，并承诺将与 OpenMessaging 开源标准社区共同努力营造良好的开源环境，打造厂商中立，面向 Cloud Native ，同时对流计算以及大数据生态友好的下一代分布式消息标准。至此，已经加入 OpenMessaging 开源标准社区的企业有阿里巴巴、Datapipeline、滴滴出行、浩鲸科技、京东商城、青云QingCloud、Streamlio、微众银行、Yahoo、中国移动苏州研发中心（按首字母排序）等来自互联网、软件服务、金融和运营商行业的10家企业，覆盖中美两个国家。此外，已获得RocketMQ、RabbitMQ 和 Pulsar3个顶级消息开源厂商的支持。 OpenMessaging是国内首个在全球范围内发起的分布式消息领域国际标准，旨在为分布式消息分发，创建面向全球、面向云、供应商中立的开放标准，可以部署在云端、内部和混合云情景中，以解决以上的两大问题。除了做到可以链接跨平台、跨语言、跨产品和跨云的标准之外，OpenMessaging还将提供Cloud Nativ...

2018-11-14

741

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。