从 Vision 到 Language 再到 Action，万字漫谈三年跨域信息融合研究-低调大师

从 Vision 到 Language 再到 Action，万字漫谈三年跨域信息融合研究

2018-05-20 956

本文作者为阿德莱德大学助理教授吴琦，他在为雷锋网 AI 科技评论投递的独家稿件中回顾了他从跨领域图像识别到 Vision-to-Language 相关的研究思路，如今正将研究领域延伸到与 Action 相关的工作。雷锋网 AI 科技评论对文章做了不改动原意的编辑。

大家好，我叫吴琦，目前在阿德莱德大学担任讲师（助理教授）。2014 年博士毕业之后，有幸加入澳大利亚阿德莱德大学（University of Adelaide）开始为期 3 年的博士后工作。由于博士期间主要研究内容是跨领域图像识别，所以博士后期间，原本希望能够继续开展与跨领域相关方面的研究。但是，在与博士后期间的导师 Anton van den Hengel、沈春华教授讨论之后，决定跳出基于图像内部的跨领域研究，而展开图像与其他外部领域的跨领域研究。恰逢 2015 年 C

微信关注我们

原文链接：https://yq.aliyun.com/articles/594689

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

图像识别攻击还没完全解决，语音识别攻击又来了！

当前的语音识别技术发展良好，各大公司的语音识别率也到了非常高的水平。语音识别技术落地场景也很多，比如智能音箱，还有近期的谷歌 IO 大会上爆红的会打电话的 Google 助手等。本文章的重点是如何使用对抗性攻击来攻击语音识别系统。本文发表在 The Gradient 上，雷锋网将全文翻译如下。假设你在房间的角落放一台低声嗡嗡作响的设备就能阻碍 NSA 窃听你的私人谈话。你会觉得这是从来自科幻小说吗？其实这项技术不久就会实现。今年 1 月，伯克利人工智能研究人员 Nicholas Carlini 和 David Wagner 发明了一种针对语音识别 AI 的新型攻击方法。只需增加一些细微的噪音，这项攻击就可以欺骗语音识别系统使它产生任何攻击者想要的输出。论文已经发表在 https://arxiv.org/pdf/1801.01944

2018-05-20

729

6月28日，2016网易未来科技峰会在北京国贸大酒店举行，搜狗CTO杨洪涛进行了主题演讲——《人工智能里的产品观》。杨洪涛认为：“人工智能本身并不创造价值，使用AI技术的好产品才创造价值。以场景思考产品，回归用户欲望，通过技术手段解决才有可能产生出好产品。” “计算力+数据+服务”是三大核心要素杨洪涛讲道，机器学习与深度学习在应用角度的两大要素如今已经较为成熟。一方面是计算力，伴随着CPU、GPU，以及各种分布式计算和专用计算平台的发展，这在一定程度上保障了计算力的提升；另一方面，移动互联网的发展带来了大量的数据，而对于互联网产品提供商来说，其接触到的数以亿计的用户，以及用户生产的庞大数据更是助力人工智能的丰厚资源。然而当谈到产品化，要让“计算力+数据”的闭环做得更好，“服务”就成了一个不可忽视，且至关重要的元素。杨洪涛表示：“正是在服务的使用之中，用户才产生了数据，而数据又在消耗着计算力，对计算力的发展提出更高要求，从而为用户带来更好地体验。用户体验的提升则逆向推动用户使用服务，从而产生更多的数据。因此，计算力+数据+服务是一个产品迭代的完整循环。” 他还提到，现在许多公司把目光...

2018-05-21

601

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。