【人工智能】AI 新玩法，纳秒完成图像识别-低调大师

【人工智能】AI 新玩法，纳秒完成图像识别

2020-03-18 771

云栖号资讯：【点击查看更多行业资讯】
在这里您可以找到不同行业的第一手的上云资讯，还在等什么，快来！

维也纳大学的工程师团队带来了 AI 芯片的新玩法。他们利用传感器人工神经网络大大提高了处理图片的效率，可在纳秒内完成图像识别任务。他们的设计思路是将一些计算任务转移到计算机系统外部边缘的感知设备上，这样可以减少不必要的数据移动，进而产生了这种机器视觉的传感器内计算研究成果。

近日，维也纳大学研发出了一种新型的图像传感器设备，它自带人工神经网络，可以同时捕获和识别光学图像，无需再将信息转换成数字格式即可快速处理信息。

视觉是我们最重要的感官之一。在过去的十年中，受生物学启发的机器视觉得到了迅速的发展，人工系统可以通过传感机器从图像和视频中获得有价值的信息，进而有了“看到”的能力，虽然这种能力比人类的视觉能力还是差了很远。Mennel 等人在《自然》杂志上刊登了一种新的视觉系统研究成果，该系统设计模仿了人脑对信息的处理方式，只用纳秒级的时间就能对简单图像进行分类。

现代图像传感器，如数码相机中的图像传感器，是基于半导体 (固态) 技术，于上世纪 70 年代初发明的；它们主要分为两种类型，即电荷耦合器件和有源像素传感器。这些传感器可以从环境中准确地捕获视觉信息，但同时也会产生大量冗余数据。这些海量的光学信息通常被转换成数字电子格式，然后再传递给计算单元进行图像处理。

传感器和处理单元之间大量数据的移动往往会导致延迟和高功耗问题。随着成像速率和像素数量的增长，再加上带宽限制，把所有数据都发送到云端，让云计算机集中处理又不能满足实时快速处理和决策的需要。这恰恰也是现在无人驾驶汽车、机器人、工业制造等对延迟敏感的领域所不能接受的。

优化之后的解决方案是将一些计算任务转移到计算机系统外部边缘的感知设备上，这样可以减少不必要的数据移动。由于传感器通常产生的都是模拟输出，而模拟到数字的转换既耗时又耗能，因此模拟处理比数字处理更可取。

图 1 输入信息在视觉传感器内进行计算，实现智能、高效的预处理

传统的人工智能 (AI) 视觉传感器如图（a）所示，信号在光响应传感器上进行收集，通过模数转换器（ADC）将模拟信号转换为数字信号，放大后作为输入提供给外部的人工神经网络 (ANN)，再经过参数调优训练神经网络，可以用来执行诸如图像分类等任务。

神经网络的输入层接收编码简单物理元素的信号 (这里用点和线表示)，在随后的层中，这些信号被优化为中级特征 (简单的形状)，最后在输出层 (3D 形状) 形成精细的图像。整体的响应可能是比较缓慢和耗能的。

Mennel 等人研发的视觉系统如图（b）所示，在这个系统中，芯片上的相互连接的传感器 (正方形) 不仅可以收集信号，而且还可以作为一个神经网络来识别简单的特征，从而减少传感器和外部电路之间冗余数据的移动。

Mennel 和同事们在他们的图像传感器中直接实现了一个人工神经网络。在芯片上，他们构建了一个光二极管网络，这些光二极管是微小的光敏元件，每一个都由几层二硒化钨原子组成。二硒化钨对光的响应可以通过改变施加的电压来增加或减少，因此每个二极管的灵敏度可以单独调整。这就将光敏传感器网络转变为了一个神经网络 (图 1b)，并使其能够执行简单的计算任务。改变光电二极管的光响应度，也就会改变网络中的连接权重。因此，该装置其实是结合了光学传感和神经形态计算。

作者将光电二极管排列成一个 9 像素的正方形阵列，每个像素有 3 个二极管。当一个图像被投射到芯片上时，各种二极管电流被产生、合并和读取。硬件阵列提供了一种模拟计算形式：每个光电二极管都会产生与入射光强度成比例的输出电流，并且根据基尔霍夫定律 (电路中电流的基本规则)，将沿行或列得出的电流相加。

然后就可以训练该阵列来执行相应任务了。阵列产生的电流和预测的电流之间的差异 (如果阵列对给定任务的图像做出正确的响应，就会产生电流) 将在芯片外进行分析，并用于调整下一个训练周期的权重。这个学习阶段会消耗时间和计算资源，但是一旦经过训练，芯片就能快速完成设定的任务。

利用不同的神经网络算法，作者演示了两种神经形态功能。第一个是分类：他们用 3×3 像素阵列，将一幅图像分成三个类中的一个，这三个类对应于三个简化的字母，从而在纳秒内识别出它是哪个字母。这个相对简单的任务只是一个概念的证明，如果按比例增加阵列的大小，它可以扩展到识别更复杂的图像。

第二个例子是自动编码：即使在存在信号噪声的情况下，传感器内的计算阵列也可以通过学习图像的关键特征，来生成经过处理的图像的简化表示。编码后的版本只包含最基本的信息，但可以通过解码来重建接近原始的图像。

但在这项技术实际落地应用之前，还有很多工作要做。首先，用于自动驾驶汽车和机器人的神经形态视觉系统，需要在三维空间和广阔的视野中捕捉动态图像和视频。而目前使用的图像捕获技术通常是将三维现实世界转换为二维信息，丢失掉运动信息和深度。现有图像传感器阵列的平面形状也制约着广角相机的发展。

其次，该系统的传感器设备很难在昏暗的光线下成像，需要重新设计，以改善半导体的光吸收能力，并增加可检测到的光强范围。此外，该设计要求高电压，功耗大；相比之下，在生物神经网络中，每次操作的能量消耗在亚焦耳级（10 -15 至 10 -13 焦耳）。充分扩大对紫外线和红外光的响应范围，捕捉可见光光谱中得不到的信息，对后续技术优化也会很有帮助。

还有一点，研究使用的薄半导体很难在大范围内均匀生产，而且很难加工处理，因此它们很难与硅电子器件集成，比如用于读出或反馈控制的外部电路。使用这些传感器的设备的速度和能源效率将不是由图像捕获过程决定的，而是由传感器和外部电路之间的数据移动决定的。此外，虽然传感器内的计算单元在模拟域收集和计算数据，减少了模拟到数字的转换，但外围电路仍然受到其他固有延迟的影响。传感器和外部电路将需要协同开发，以减少整个系统的延迟。

Mennel 及其同事的“传感器内计算系统”应该会激发业内对人工智能 (AI) 硬件的进一步研究。一些公司已经开发了基于硅电子的人工智能视觉芯片，但这些芯片固有的数字体系架构往往带有延迟和电力效率问题。

从更广泛意义来讲，该研究团队的策略并不局限于视觉系统。它可以扩展到其他物理输入，如听觉、触觉、热感或嗅觉感知等。这种智能系统的发展，加上 5G 高速无线网络的到来，应该会让未来的实时 (低延迟) 边缘计算成为可能。

原文发布时间：2020-03-19
本文作者：nature
本文来自：InfoQ 了解相关信息可以关注“InfoQ”

【云栖号在线课堂】每天都有产品技术专家分享！
课程地址：https://yqh.aliyun.com/zhibo

立即加入社群，与专家面对面，及时了解课程最新动态！
【云栖号在线课堂社群】https://c.tb.cn/F3.Z8gvnK

微信关注我们

原文链接：https://yq.aliyun.com/articles/750532

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

“人工智能+教育”带来哪些机遇与挑战

云栖号资讯：【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯，还在等什么，快来！当人们谈论人工智能以怎样的新形态出现在面前时，教育界却正在发生一轮新的变革。在新一轮变革推动下,人工智能、大数据、互联网等前沿科技正加速应用于教育领域。在信息时代，人工智能将为教育行业带来哪些机遇和挑战?这是人们普遍关心的问题。前不久, 我国教育家顾明远先生表示，“人工智能+教育”正在引起关于教育的一场革命。他认为，要充分认识“人工智能+教育”的育人功能，是当前教育工作者遇到的重要挑战。联合国教科文组织于2019年8月发布了《北京共识——人工智能与教育》;据悉，这是联合国教科文组织首个为利用人工智能技术实现2030年教育议程提供指导和建议的重要文件。该文件提出，各国要引领实施适当的政策应对策略，通过人工智能与教育的系统融合，全面创新教育、教学和学习方式，并利用人工智能加快建设开放灵活的教育体系，确保全民享有公平、适合每个人且优质的终身学习机会，从而推动可持续发展目标和人类命运共同体的实现。 “人工智能+教育”主要是要改变传统的教学方式，要从教师的教转变到学生的学。教师要充分发挥学生的主...

2020-03-18

729

云栖号资讯：【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯，还在等什么，快来！ Java 14今天正式发布了。那么，14版究竟有什么新功能，对于整天写代码、维护代码的Java开发者来说，哪些功能最有用呢？第14版包含的JEP（Java Enhancement Proposals，Java增强提案）比12版和13版加起来还要多。在这篇文章中，我将主要讨论以下几点： 1、改进的switch表达式，第一次出现在Java 12和13中，在Java 14中获得了完全的支持2、instanceof支持模式匹配（语言特性）3、NullPointerException（JVM特性）希望你在阅读完本文后，积极地代码中实验这些功能，为Java团队提供反馈，并为Java的发展做出贡献。 Switch表达式 Java 14中的switch表达式将会永久存在。如果你需要回忆一下什么是switch表达式，可以参考以前这两篇文章。在公众号互联网架构师后台回复：2T，可以获取架构师视频整套系统教程。在之前的发布中，switch表达式只是一个“预览”阶段的特性。我想提醒一下，“预览”阶段的特性...

2020-03-18

824

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。