深度学习之视频人脸识别系列一：介绍-低调大师

深度学习之视频人脸识别系列一：介绍

2018-07-15 651

作者 | 东田应子

【导读】本文是深度学习之视频人脸识别系列的第一篇文章，介绍了人脸识别领域的一些基本概念，分析了深度学习在人脸识别的基本流程，并总结了近年来科研领域的研究进展，最后分析了静态数据与视频动态数据在人脸识别技术上的差异。

一、基本概念

人脸识别（face identification）

人脸识别是1对n的比对，给定一张人脸图片，如何在n张人脸图片中找到同一张人脸图片，相对于一个分类问题，将一张人脸划分到n张人脸中的一张。类似于管理人员进行的人脸识别门禁系统。

2.人脸验证（face verification）

人脸验证的1对1的比对，给定两张人脸图片，判断这两张人脸是否为同一人，类似于手机的人脸解锁系统，事先在手机在录入自己的脸部信息，然后在开锁时比对摄像头捕捉到的人脸是否与手机上录入的人脸为同一个人。

3.人脸检测（face detection）

人脸检测是在一张图片中把人脸检测出来，即在图片上把人脸用矩形框出来，并得到矩形的坐标，如下图所示。

~~、~~

4.人脸关键点检测

根据输入的人脸图像，识别出面部关键特征点，如眼睛、鼻尖、嘴角点、眉毛以及人脸各部件轮廓点的坐标，如下图所示。

5.人脸矫正（人脸对齐）

通过人脸关键点检测得到人脸的关键点坐标，然后根据人脸的关键点坐标调整人脸的角度，使人脸对齐，由于输入图像的尺寸是大小不一的，人脸区域大小也不相同，角度不一样，所以要通过坐标变换，对人脸图像进行归一化操作，如下图所示。

二、基于深度学习的人脸识别算法基本流程

随着神经网络的迅速发展和其对图像数据的强大的特征提取，深度学习运用于人脸识别也成为热点研究方向；2014年的开山之作DeepFace，第一个真正将大数据和深度学习结合应用于人脸识别与验证，确立人脸识别的常规流程：图片->人脸与关键点检测->人脸对齐->人脸表征（representation）->分类。首先将图片中的人脸检测处理并通过关键点进行对齐，如何输入到神经网络，得到特征向量，通过分类训练过程，该向量即为人脸的特征向量。要求出两张人脸的相似度即计算两个特征的向量度量之差，方法包括：SVM、SiameseNetwork、JointBayesian、L1距离、L2距离、cos距离等。

三、科研领域近期进展

科研领域近期进展主要集中于loss函数的研究，包括DeepId2（Contrastive Loss）、FaceNet（Triplet loss）、L-Softmax、SphereFace（A-Softmax）、Center Loss、L2-Softmax、NormFace、CosFace（AM-Softmax）、ArcFace（AA-Softmax）等。

四、基于视频人脸识别和图片人脸识别的区别（该小结部分参考于博客园 - 米罗西）

相对于图片数据，目前视频人脸识别有很多挑战，包括：（1）视频数据一般为户外，视频图像质量比较差；（2）人脸图像比较小且模糊；（3）视频人脸识别对实时性要求更高。

但是视频数据也有一些优越性，视频数据同时具有空间信息和时间信息，在时间和空间的联合空间中描述人脸和识别人脸会具有一定提升空间。在视频数据中人脸跟踪是一个提高识别的方法，首先检测出人脸，然后跟踪人脸特征随时间的变化。当捕捉到一帧比较好的图像时，再使用图片人脸识别算法进行识别。这类方法中跟踪和识别是单独进行的，时间信息只在跟踪阶段用到。

【总结】：本期文章主要介绍了基于深度学习的人脸识别算法的一些基本入门知识，下一期我给大家介绍人脸识别中获取神经网络输入的算法，即关于人脸检测、人脸关键点检测与人脸对齐的一些重要算法和相关论文解析。

人脸矫正（人脸对齐）

通过人脸关键点检测得到人脸的关键点坐标，然后根据人脸的关键点坐标调整人脸的角度，使人脸对齐，由于输入图像的尺寸是大小不一的，人脸区域大小也不相同，角度不一样，所以要通过坐标变换，对人脸图像进行归一化操作，如下图所示。

微信关注我们

原文链接：https://yq.aliyun.com/articles/623586

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

2018五大人工智能趋势，你知道多少？

人类一直对机器人和人工智能（AI）的概念保持非常强的好奇心。好莱坞电影和科幻小说可能激发了一些科学家开始朝着这个方向努力，虽然人工智能泡沫已出现多次，但目前重大的发展和突破正在重新引起公众对这一领域的兴趣。 2018年我们需要关注AI的相关领域，因为变革正在慢慢来临，其中包括自然语言处理（NLP），机器学习，认知计算，神经网络，计算机视觉和机器人及其相关技术。在本文中，我们将解释围绕所有这些技术的五个不断变化的趋势，并了解它们的好处。 1.机器学习模型的民主化机器学习旨在使计算机能够从数据中学习并在不依赖于程序中命令的情况下进行改进。这种学习最终可以帮助计算机构建模型，例如用于预测天气的模型。这里，我们介绍了一些利用机器学习的常见应用程序： 1.1财务应用随着金融科技创业公司挑战现有企业，金融业正在迅速发展。这些现有企业中的许多人主要依

2018-07-14

702

机器视觉作为机器的眼睛重要性不言而喻，近年来我国机器视觉产业发展已经迈入高速发展期，市场资本、技术研发和政府政策起到重要驱动作用。对于智能机器人来说，机器视觉就是它们的眼睛!作为人工智能的一个分支，机器视觉综合了工业智能相机、图像处理、机械工程、电光源照明、光学成像、传感器等多项技术，用机器代替人眼来做出判断和测量，是提高生产灵活性和自动化的一个重要因素。据相关统计数据显示，从2011年至2017年，国内机器视觉行业市场从10亿元迅速扩大至70亿元规模，市场增速长期维持在两位数左右。目前，我国已经成为继美国和日本之后的第三大机器视觉市场，发展潜力正在不断显现。近年来，伴随着在半导体和电子电器领域的突出表现，其在国际市场的发展逐渐步入到成熟阶段。而我国由于上世纪80年代才开始引进机器视觉技术，起步和应用相对较晚，目前市场发展仍处于初级阶段。自2010年开始，我国机器视觉市场逐渐步入成长期，产业发展日益加速。被广泛应用于工业、农业、交通、医药、军事等各大行业，在全球“工业4.0”和自动化需求之下，更是取得了高速的发展。综合以往的发展来看，近年来国内机器人视觉行业之所以能够出现发展加速期，主...

2018-07-16

693

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。