首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/171761

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

深度学习奏响智能视频分析技术新乐章

在2017年两会热词中,被誉为互联网下一个风口的人工智能,成为两会期间大众的关注热点,与创业紧紧联系在一起,成为创业者的新宠。同时,网友也热衷于深扒人工智能背后的“黑科技”,深度学习技术也因此成为关注点聚焦。其实,深度学习和安防搭配食用更美味。 深度学习奏响智能视频分析技术新乐章 随着各地视频接入规模的迅猛增长及视频监控对高清、智能、联网的要求越来越高,每天产生的数据量正以惊人的速度在不停增长。视频监控正迎来全新的大数据时代,数据越来越成为最宝贵的资源,如何有效对数据进行存储、共享以及应用变得愈加重要。在这个新时代,智能化也成为视频监控的新趋势。 一、传统智能视频分析技术的不足 智能视频分析技术利用一些图像处理、模式识别或机器学习等领域的算法来分析视频序列中的信息,以达到理解视频内容的目的,也有人称为视频内容分析。有了智能视频分析技术,我们就可以及时地发现视频中的异常情况,第一时间做出反应,减少损失。 当我们还在憧憬着智能视频分析技术的前景时,现实给所有安防智能化厂商上了沉重的一课。很多智能视频分析技术受限于应用场景,为了得到较好的准确率,往往需要“天时”、“地利”和“人和”。好不容易...

IBM宣布语音识别错误率接近人类水平

3月10日消息,据IBM官网报道,人们在说话时,对方每听20个单词都会漏掉或听错1-2个单词。在5分钟的对话中,可能会听错80个单词。但我们多数人在听懂说话上没有问题。然而,电脑就不一样了。 去年,IBM宣布在自然对话环境中的语音识别上取得重大成就:开发出单词错误率为6.9%的系统。此后,该公司不断取得进步。现在IBM宣布创造新的业界纪录:5.5%的错误率。这是对非常困难的语音识别任务:纪录人与人之间日常对话如“买汽车”,计算出来的结果。这种纪录的语料库被称为“SWITCHBOARD”,20多年来一直用于检验语音识别系统。 IBM研究人员在实现这个突破时,专注于应用深度学习技术,将LSTM(长短期记忆)和WaveNet语言模型与三个强大的声学模型结合起来。在被使用的3个声学模型中,前2个为双向6层LSTM,其中一个为多特征输入,另一个有对话多任务学习能力。最后一个模型有个独特的地方,其不仅能从积极的例子中学习,也能利用消极的例子,因此会变得越来越聪明,在重复出现类似说话风格时表现更好。 实现人类同等水准——错误率与2个人说话相当——长期以来都是行业的终极目标。行业里的其他人也在努力追赶...

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。