依图科技再破世界记录！AutoML取代人工调参，刷榜三大权威数据集

2020-03-31 704

云栖号资讯：【点击查看更多行业资讯】
在这里您可以找到不同行业的第一手的上云资讯，还在等什么，快来！

近年来，行人重识别技术在业内得到了越来越多的关注，CVPR投稿中关于ReID的研究逐年增多。随着行人重识别技术的日渐成熟，其巨大的应用价值和市场潜力得到了越来越多的关注。

杀手级视觉应用即将面世？依图视觉识别创新纪录

2020年还有再问人脸识别之后的下一个风口是什么？

别问，问就是行人重识别。（ReID）

对于这个问题，业界似乎早已有了共识。从AI的人脸识别能力超越人类以来，学术界和产业界的目光逐渐转向另一个更具科研意义和应用价值的课题——行人重识别（Person Re-identification，ReID）。

近日，依图科技宣布在ReID领域取得突破，刷新全球工业界三大权威数据集当前最优成绩（SOTA），算法性能达到业界迄今最高标准。

成绩单上的公司可谓赫赫有名，包括阿里巴巴，腾讯优图、博观智能、海格通信，中兴等强手林立，充分说明了如今ReID要想取得1%的进步，其难度有多么的高！

也正如此，才称得上依图视觉识别杀手级视觉应用。

用AutoML取代人工调参，深度优化ReID算法框架

“首位命中率”（Rank-1 Accuracy）及“平均精度均值”（Mean Average Precision，mAP），是衡量ReID的两大关键指标。

首位命中率意味着算法能够在众多图像中准确找出最容易识别、或者说匹配的那张。而mAP值它反映的是系统的综合检索性能。mAP值越高，说明系统的实用性越好，既能查得全也能查得准，能够较好地应对多遮挡、光线暗、画面模糊等情况。

评价ReID算法性能时不能只看首位命中率，否则无法反映出模型的真实能力，尤其是应对复杂场景的表现，必须结合mAP值，综合评价。

依图科技凭借自身工程与研发实力，深度优化了ReID算法框架，显著提升了算法效率，通过结合AutoML等前沿技术，进一步创新性地实现了模型参数的自动搜索与迭代，突破了依赖算法研究员手工设计与调参的传统算法开发流程，也使得算法的泛化性能更强。

此次依图自研算法在业界最具影响力的三大ReID数据集Market1501、DukeMTMC-ReID、CUHK03上，将衡量算法性能的两大关键指标“首位命中率”（Rank-1 Accuracy）及“平均精度均值”（Mean Average Precision，mAP）6项数据全部提升，充分显示了依图的技术实力，进一步稳固了中国AI在该任务下领跑地位。

何为行人重识别？

行人重识别（Person Re-identification也称行人再识别，简称为ReID，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。通常被认为是一个图像检索的子问题。给定一个监控行人图像，检索跨设备下的该行人图像。

哈利·波特在《阿兹卡班囚徒》中使用实点图实时追踪并识别追踪人。

行人重识别的研究方法主要有以下几种：

基于表征学习的ReID方法

这类方法通常有两个网络，分类子网络对图片进行ID预测，根据预测的ID来计算分类误差损失。验证子网络融合两张图片的特征，判断这两张图片是否属于同一个行人，该子网络实质上等于一个二分类网络。经过足够数据的训练，再次输入一张测试图片，网络将自动提取出一个特征，这个特征用于行人重识别任务。

基于度量学习的ReID方法

度量学习是广泛用于图像检索领域的一种方法。不同于表征学习，度量学习是通过网络学习出两张图片的相似度。在行人重识别问题上，具体为同一行人的不同图片相似度大于不同行人的不同图片。最后网络的损失函数使得相同行人图片的距离尽可能小，不同行人图片的距离尽可能大。

基于局部特征的ReID方法

早期的ReID研究主要关注点在全局的global feature上，就是用整图的特征向量进行图像检索。但是后来大家逐渐发现全局特征遇到了瓶颈，于是开始渐渐研究局部的local feature。

基于视频序列的ReID方法

跟基于单张图像的方法相比，最主要的不同点是不仅考虑了图像的内容信息，还考虑了帧与帧之间的运动信息。

以上内容授权自知乎作者浙江大学博士罗浩。如果这些方法与人脸识别相结合，将会产生更大的应用价值。

除了智能零售、智慧交通、智能城市等经常提及的应用场景，ReID技术的应用也将使日常生活更加便捷：游乐园更易寻找走失儿童、宠物/家庭机器人可以凭背影准确识别主人或顾客并提供相应服务。

然而，在监控视频中，由于相机分辨率和拍摄角度的缘故，通常无法得到高质量的人脸图片。当人脸识别失效的情况下，ReID就成为了一个非常重要的技术手段。单个摄像头的覆盖区域有限，因此做行人分析的话需要多摄像头协作，而通常情况下各摄像头位于不同的位置和视角，其视域互不重叠，为解决摄像头网络下的广域行人分析，就必须首先解决跨视域多摄像头下行人再识别的问题。

由于ReID需要从不同摄像机拍摄的图像或视频中找出同一个人物，而这些摄像机所覆盖的范围彼此并不重叠，导致缺乏连贯的信息，而且不同画面中人物的姿态、行为甚至外观（比如戴上帽子、脱下外套）会发生较大变化，不同时间、场景的光照、背景和遮挡物各不相同（背景中常还有体型、衣着相似的其他人物干扰），摄像机的分辨率也有高有低，这些都对ReID技术提出了极大的挑战。

自研求索芯片，仅凭穿着实现高精度行人重识别

任何没有经历过商业化检验的项目，都只是空中楼阁而已。

所以，对于依图这样的公司来说，只是调调参，刷刷榜，那是远远不够的。

所有的研究数据，都需要在市场上接受商业化的检验，才能真正让企业百炼成金。

因为商业化落地所面临的问题，和实验室遇到的难题相比，复杂度提升了不止一个等级。除了对算法性能的要求，还有一个非常难的问题，是现有的摄像机等终端设备算力不够。

而依图研发人员通过自研的云端AI芯片QuestCore™（求索），将将训练+推理耗时压大幅缩短，在仅凭穿着、步态特征的条件下，依图可以将ReID做到大约两年前人脸识别的水平。

2018年，ImageNet竞赛已经停办，因为计算机识别人脸/物体的能力早已超越人类，继续“刷榜”已经没有意义。2018年，也是以人脸识别为代表的计算机视觉应用大规模商用的开始。

两年后的今天，刷脸支付、刷脸乘车已经愈发普及。

在显著提高ReID精度的同时，依图凭自研的云端AI芯片QuestCore™（求索）实现了技术商业化落地，业界期待的下一个计算机视觉“杀手级应用”已经到来。

对此您怎么看？

【云栖号在线课堂】每天都有产品技术专家分享！
课程地址：https://yqh.aliyun.com/zhibo

立即加入社群，与专家面对面，及时了解课程最新动态！
【云栖号在线课堂社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间：2020-03-31
本文作者：新智元
本文来自：“新智元”，了解相关信息可以关注“新智元”

微信关注我们

原文链接：https://yq.aliyun.com/articles/752662

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Apache Flink 进阶（十二）：深度探索 Flink SQL

作者：贺小令（晓令）整理：郑仲尼本文根据 Apache Flink 进阶篇系列直播整理而成，由阿里巴巴技术专家贺小令分享，文章将从用户的角度来讲解 Flink 1.9 版本中 SQL 相关原理及部分功能变更，希望加深大家对 Flink 1.9 新功能的理解，在使用上能够有所帮助。主要内容: 新 TableEnvironment 的设计与使用场景新 Catalog 的设计以及 DDL 实践 Blink Planner 的几点重要改进及优化新 TableEnvironment FLIP-32 中提出，将 Blink 完全开源，合并到 Flink 主分支中。合并后在 Flink 1.9 中会存在两个 Planner：Flink Planner 和 Blink Planner。在之前的版本中，Flink Table 在整个 Flink 中是一个二等公民。而 Flink SQL 具备的易用性，使用门槛低等特点深受用户好评，也越来越被重视，Flink Table 模块也因此被提升为一等公民。而 Blink 在设计之初就考虑到流和批的统一，批只是流的一种特殊形式，所以在将 Blink 合并到...

2020-03-30

553

云栖号资讯：【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯，还在等什么，快来！随着企业IT运营逐渐从本地上云，他们就开始寻找从内部数据中心引入云运营的安全访问控制方法。云访问安全代理(CASB)就是这样的一种工具。如今，CASB已推出十年，它是企业安全基础结构的常见组成部分。但是对于许多人来说，确切地了解CASB的功能，为什么它不同于下一代防火墙，这仍然是一个谜。本文将带大家来研究一下CASB，阐述它的来源以及演变。 CASB的最初目的是提供企业基础架构中所有云服务的可见性。在和“影子IT”以及未授权的云服务对抗中，CASB是第一种专用武器。CASB部署在网络边界并使用多种代理类型，可以识别对云服务的每次响应或从云服务进行的连接，无论这项云服务是否被批准。在CASB创建之初，它们经常作为物理设备部署在客户数据中心。现在，它们仍可以部署，但更多地以“安全即服务”(SaaS)模型部署为云服务本身。在这两种情况下，现在的CASB都使用代理和API来识别尽可能大范围的云服务，并根据产品现在具有的附加功能采取行动。知道云服务的存在并不等同于对其进行保护(或针对特定服务...

2020-03-31

652

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。