深度学习之视频人脸识别系列(一):简介
【磐创AI导读】本文是深度学习之视频人脸识别系列的第一篇文章,介绍了人脸识别领域的一些基本概念,分析了深度学习在人脸识别的基本流程,并总结了近年来科研领域的研究进展,最后分析了静态数据与视频动态数据在人脸识别技术上的差异。
一、基本概念
- 人脸识别(face identification)
人脸识别是1对n的比对,给定一张人脸图片,如何在n张人脸图片中找到同一张人脸图片,相对于一个分类问题,将一张人脸划分到n张人脸中的一张。类似于管理人员进行的人脸识别门禁系统。
2.人脸验证(face verification)
人脸验证的1对1的比对,给定两张人脸图片,判断这两张人脸是否为同一人,类似于手机的人脸解锁系统,事先在手机在录入自己的脸部信息,然后在开锁时比对摄像头捕捉到的人脸是否与手机上录入的人脸为同一个人。
3.人脸检测(face detection)
人脸检测是在一张图片中把人脸检测出来,即在图片上把人脸用矩形框出来,并得到矩形的坐标,如下图所示。
- 人脸关键点检测
根据输入的人脸图像,识别出面部关键特征点,如眼睛、鼻尖、嘴角点、眉毛以及人脸各部件轮廓点的坐标,如下图所示。
- 人脸矫正(人脸对齐)
通过人脸关键点检测得到人脸的关键点坐标,然后根据人脸的关键点坐标调整人脸的角度,使人脸对齐,由于输入图像的尺寸是大小不一的,人脸区域大小也不相同,角度不一样,所以要通过坐标变换,对人脸图像进行归一化操作,如下图所示。
二、基于深度学习的人脸识别算法基本流程
随着神经网络的迅速发展和其对图像数据的强大的特征提取,深度学习运用于人脸识别也成为热点研究方向;2014年的开山之作DeepFace,第一个真正将大数据和深度学习结合应用于人脸识别与验证,确立人脸识别的常规流程:图片->人脸与关键点检测->人脸对齐->人脸表征(representation)->分类。首先将图片中的人脸检测处理并通过关键点进行对齐,如何输入到神经网络,得到特征向量,通过分类训练过程,该向量即为人脸的特征向量。要求出两张人脸的相似度即计算两个特征的向量度量之差,方法包括:SVM、SiameseNetwork、JointBayesian、L1距离、L2距离、cos距离等。
三、科研领域近期进展
科研领域近期进展主要集中于loss函数的研究,包括DeepId2(Contrastive Loss)、FaceNet(Triplet loss)、L-Softmax、SphereFace(A-Softmax)、Center Loss、L2-Softmax、NormFace、CosFace(AM-Softmax)、ArcFace(AA-Softmax)等。
四、基于视频人脸识别和图片人脸识别的区别(该小结部分参考于博客园 - 米罗西http://www.cnblogs.com/zhehan54/p/6727631.html)
相对于图片数据,目前视频人脸识别有很多挑战,包括:(1)视频数据一般为户外,视频图像质量比较差;(2)人脸图像比较小且模糊;(3)视频人脸识别对实时性要求更高。
但是视频数据也有一些优越性,视频数据同时具有空间信息和时间信息,在时间和空间的联合空间中描述人脸和识别人脸会具有一定提升空间。在视频数据中人脸跟踪是一个提高识别的方法,首先检测出人脸,然后跟踪人脸特征随时间的变化。当捕捉到一帧比较好的图像时,再使用图片人脸识别算法进行识别。这类方法中跟踪和识别是单独进行的,时间信息只在跟踪阶段用到。
【总结】:本期文章主要介绍了基于深度学习的人脸识别算法的一些基本入门知识,下一期我给大家介绍人脸识别中获取神经网络输入的算法,即关于人脸检测、人脸关键点检测与人脸对齐的一些重要算法和相关论文解析。
原文发布时间为:2018-07-16
本文作者:东田应子
本文来自云栖社区合作伙伴“磐创AI”,了解相关信息可以关注“磐创AI”。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
国内机器视觉发展潜力正在不断显现
机器视觉作为机器的眼睛重要性不言而喻,近年来我国机器视觉产业发展已经迈入高速发展期,市场资本、技术研发和政府政策起到重要驱动作用。对于智能机器人来说,机器视觉就是它们的眼睛!作为人工智能的一个分支,机器视觉综合了工业智能相机、图像处理、机械工程、电光源照明、光学成像、传感器等多项技术,用机器代替人眼来做出判断和测量,是提高生产灵活性和自动化的一个重要因素。据相关统计数据显示,从2011年至2017年,国内机器视觉行业市场从10亿元迅速扩大至70亿元规模,市场增速长期维持在两位数左右。目前,我国已经成为继美国和日本之后的第三大机器视觉市场,发展潜力正在不断显现。近年来,伴随着在半导体和电子电器领域的突出表现,其在国际市场的发展逐渐步入到成熟阶段。而我国由于上世纪80年代才开始引进机器视觉技术,起步和应用相对较晚,目前市场发展仍处于初级阶段。自2010年开始,我国机器视觉市场逐渐步入成长期,产业发展日益加速。被广泛应用于工业、农业、交通、医药、军事等各大行业,在全球“工业4.0”和自动化需求之下,更是取得了高速的发展。综合以往的发展来看,近年来国内机器人视觉行业之所以能够出现发展加速期,主...
- 下一篇
阿里云开启多媒体搜索新时代,发布全域精准图像搜索
随着互联网的快速发展及多媒体数据的爆炸式增长,图像搜索已成为企业在搭建搜索引擎时亟需的重要技术。 7月11日,阿里云宣布由阿里巴巴机器智能技术实验室打造图像搜索产品正式商用,开启了多媒体搜索的新时代,将图像搜索这个“贵族技术”变为“平民技术”。目前阿里巴巴机器智能技术实验室已将图像搜索的范围从最初的服装、鞋包、配饰、食品、数码、家居、日用百货、瓶饮等商品类目扩展到汽车、布料、商标、建筑、景观等通用类目,可广泛应用于搜索引擎、电商、纺织业、皮革业、旅游业等生活的方方面面,让图像搜索技术得到更广泛的行业应用。 图像搜索核心技术及优势 图像搜索是以深度学习和大规模机器学习技术为核心,通过图像识别和搜索功能,实现以图搜图的智能图像搜索产品。图像搜索服务在基于图像识别技术基础上,结合不同行业应用和业务场景,帮助用户实现相同或相似图片搜索。目前阿里
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7设置SWAP分区,小内存服务器的救世主
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2整合Redis,开启缓存,提高访问速度
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题