从 Vision 到 Language 再到 Action,万字漫谈三年跨域信息融合研究
本文作者为阿德莱德大学助理教授吴琦,他在为雷锋网 AI 科技评论投递的独家稿件中回顾了他从跨领域图像识别到 Vision-to-Language 相关的研究思路,如今正将研究领域延伸到与 Action 相关的工作。雷锋网 AI 科技评论对文章做了不改动原意的编辑。
大家好,我叫吴琦,目前在阿德莱德大学担任讲师(助理教授)。2014 年博士毕业之后,有幸加入澳大利亚阿德莱德大学(University of Adelaide)开始为期 3 年的博士后工作。由于博士期间主要研究内容是跨领域图像识别,所以博士后期间,原本希望能够继续开展与跨领域相关方面的研究。但是,在与博士后期间的导师 Anton van den Hengel、沈春华教授讨论之后,决定跳出基于图像内部的跨领域研究,而展开图像与其他外部领域的跨领域研究。恰逢 2015 年 C
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
图像识别攻击还没完全解决,语音识别攻击又来了!
当前的语音识别技术发展良好,各大公司的语音识别率也到了非常高的水平。语音识别技术落地场景也很多,比如智能音箱,还有近期的谷歌 IO 大会上爆红的会打电话的 Google 助手等。本文章的重点是如何使用对抗性攻击来攻击语音识别系统。本文发表在 The Gradient 上,雷锋网将全文翻译如下。 假设你在房间的角落放一台低声嗡嗡作响的设备就能阻碍 NSA 窃听你的私人谈话。你会觉得这是从来自科幻小说吗?其实这项技术不久就会实现。 今年 1 月,伯克利人工智能研究人员 Nicholas Carlini 和 David Wagner 发明了一种针对语音识别 AI 的新型攻击方法。只需增加一些细微的噪音,这项攻击就可以欺骗语音识别系统使它产生任何攻击者想要的输出。论文已经发表在 https://arxiv.org/pdf/1801.01944
- 下一篇
搜狗CTO杨洪涛:该以什么样的姿势参与人工智能
6月28日,2016网易未来科技峰会在北京国贸大酒店举行,搜狗CTO杨洪涛进行了主题演讲——《人工智能里的产品观》。杨洪涛认为:“人工智能本身并不创造价值,使用AI技术的好产品才创造价值。以场景思考产品,回归用户欲望,通过技术手段解决才有可能产生出好产品。” “计算力+数据+服务”是三大核心要素 杨洪涛讲道,机器学习与深度学习在应用角度的两大要素如今已经较为成熟。一方面是计算力,伴随着CPU、GPU,以及各种分布式计算和专用计算平台的发展,这在一定程度上保障了计算力的提升;另一方面,移动互联网的发展带来了大量的数据,而对于互联网产品提供商来说,其接触到的数以亿计的用户,以及用户生产的庞大数据更是助力人工智能的丰厚资源。 然而当谈到产品化,要让“计算力+数据”的闭环做得更好,“服务”就成了一个不可忽视,且至关重要的元素。杨洪涛表示:“正是在服务的使用之中,用户才产生了数据,而数据又在消耗着计算力,对计算力的发展提出更高要求,从而为用户带来更好地体验。用户体验的提升则逆向推动用户使用服务,从而产生更多的数据。因此,计算力+数据+服务是一个产品迭代的完整循环。” 他还提到,现在许多公司把目光...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS关闭SELinux安全模块
- CentOS7设置SWAP分区,小内存服务器的救世主
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Mario游戏-低调大师作品