IBM 发布了自动为新闻播报生成字幕的 AI 模型-低调大师

IBM 发布了自动为新闻播报生成字幕的 AI 模型

2019-05-17 777

近日，IBM 研究院发布了自动为新闻播报生成字幕 AI 模型的研究报告。据两项测试实验的结果显示，该语音识别系统的错误率分别为 6.5% 和 5.9％，而人类识别的错误率分别为 3.6% 和 2.8%。

△ 图源：IBM，下同

早在两年前，IBM 就已经创造了对话式电话语音领域（CTS）转录的性能记录。在这个领域，语音识别系统需要做的工作很多。例如，系统必须处理失真、以及来自多个不同电话通道的即兴演讲，并且这些对话式语音还可能有多个对话者重叠、中断、重新开始或重复确认的情况。

新闻播报（BN）的语音识别任务也很有挑战性。语音识别系统需要处理多种说话风格、背景噪音以及广泛的新闻领域内容。一些情况下系统还得处理多种题材混合的语音材料 —— 像是现场采访、电视节目的剪辑内容等。

△ 研究进展：CTS 及 BN 测试集单词错误率逐年降低

为了成功地识别复杂的语音内容、给新闻播报内容生成字幕，IBM 研究团队通过语音识别技术，建立了一套深度神经网络。该深度神经网络在整合了长短期记忆网络和深度残差网络（residual network，ResNet）的基础上，结合了辅助的语言模型。其中，以 ResNet 为基础打造的声学模型是含有多达 25 个卷积层的深度卷积网路，使用 1,300 个小时、多种不同的新闻内容资料来训练生成字幕的 AI 模型。

虽然机器的语音识别正在逐渐接近人类水准，但目前的实验数据显示，人类的语音识别表现仍旧好得多。IBM 也表示，在这一领域仍有很大技术改进的空间。

微信关注我们

原文链接：https://www.oschina.net/news/106760/ibm-released-automatic-broadcast-news-captioning

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Stack Overflow 表示遭黑客入侵

Stack Overflow 是互联网上最大的编程和开发相关主题的问答网站，它昨天披露了一个安全漏洞，该漏洞使黑客得以访问其内部网络。 5月16日，Stack Overflow 的工程副总裁 Mary Ferguson 在官方博客发表声明，称网站在更早几日遭到入侵，目前漏洞已修补，但并未找到黑客获取用户数据的证据。他未提供更多详细信息，只是说事情正在调查中。 △图源：ZDNet 博客公告原文如下： Stack Overflow 在上周末遭受了攻击。已经确定的是，在5月11日，一定程度的生产访问权限被（黑客）获取。我们发现并调查了被访问的范围，并正在解决所有已知漏洞。目前尚未发现任何违反客户或用户数据的行为。客户和用户的安全对我们来说至关重要。在结束调查周期后，我们将提供更多信息。

2019-05-16

678

Stack Overflow 遭黑客入侵一事仍在调查中，官方博客披露了调查最新进展。入侵实际发生在5月5日，当时部署到 stackoverflow.com 的开发层的构建包含一个错误，该错误允许攻击者登录到开发层，并在网站的生产版本上升级他们的访问权限。黑客潜入系统并探索了至少5天都未被发现，直到5月11日，“入侵者对我们的系统进行了更改，以便为自己提供访问特权。这一变化很快被发现，我们撤销了他们在整个网络的访问，开始调查入侵，并采取修复措施。” 调查显示整体用户数据库没有受到损害，攻击者提出的特权 Web 请求已经确定，这些请求返回了约 250 位 Stack Exchange 用户的 IP 地址、名称或电子邮件。受影响用户将很快接到官方的通知。 Stack Overflow 团队表示会针对此次安全事件采取以下措施：终止对系统的未授权访问对所有日志和数据库进行广泛而详细的审查修复导致未经授权访问和升级的原始问题，以及在调查期间发现的任何其他潜在问题载体主动发表公开声明聘请第三方取证和事件响应公司协助进行补救采取预防措施，如重置公司密码、评估系统和安全级别等此次事件调...

2019-05-18

745

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。