OpenCV基于残差网络实现人脸检测-低调大师

OpenCV基于残差网络实现人脸检测

2018-04-04 766

OpenCV基于残差网络实现人脸检测
OpenCV3.3版本第一次把深度神经网络(DNN)模块引入到正式发布版本中，最新的OpenCV3.4中DNN模块发布了两个必杀技，一个支持Faster R-CNN的对象检测，比SSD与YOLO这些模型有更好的检测精度与小对象检测能力，另外一个是支持基于SSD+Resnet模型的人脸检测，虽然速度还达不到HAAR级联检测器的实时性，但是准确性与模型泛化能力可以说完爆HAAR级联检测器方式的人脸检测算法。作为OpenCV开发者需要人脸检测功能时候又多了一种更加可靠的选择，这里我们首先简单介绍一下什么是残差网络，然后给出其人脸检测模型在OpenCV基于摄像头实时人脸检测演示。
一：残差网络(Resnet)
最初的CNN网络LeNet与AlexNet卷积层都比较少，VGG通过小的卷积核实现了网络深度的增加取得了显著效果，但是当层数过度增加的时候就发现训练错误与测试错误都在增加，图示如下：

最开始人们以为是因为梯度消失或者梯度爆炸导致的，不过随着大家的努力，认为这个不是一个过拟合问题，而是网络褪化现象，所以针对这种情况，MSRA何凯明团队提出了一种新的网络模型-Residual Networks，其主要思想是使用残差结构来训练网络，一个残差结构如下：

作者认为F(x) = H(x)-x所以得到H(x) = F(x) + x这样的恒等映射，然后作者就建立34层plain网络与34层的残差网络作为对比，而最左边的VGG-19网络作为参考，整个的网络结构显示如下：
--- 图太大啦！！！
模型建立好的之后，作者在不同的数据集上进行了训练与测试，均观察到残差网络的效果要明显优于34层plain网络，而且发现基于残差结构的网络层数越深效果越好，而34层plain网络跟18层的plain网络相比有明显的褪化现象出现。对比训练的结果如下：

在残差网络没有出来之前，很少有网络的层数会超过100层，但是残差网络可以达到上千层，毫无疑问何凯明团队也凭借残差网络模型在2015年的ImageNet图像分类比赛中获得了冠军，当时使用152层的残差网络。OpenCV中人脸检测的残差网络模型是基于SSD实现的，所以速度还是挺快的，而且效果是特别的好。废话不多说了，下面我就看看OpenCV中如何使用它实现人脸检测。
二：人脸检测代码实现
模型是基于Caffe网络训练生成的，所以在开始写程序之前的第一件事情就是要下载模型文件与描述文件，这个我已经下载好了，大家就不用×××了，直接去我的github地址上下载模型文件即可
https://github.com/gloomyfish1998/opencv_tutorial
下载好模型之后放在本地的一个文件夹下即可，然后就可以开始编程工作啦。
首先需要加载模型成网络：

    String modelDesc = "D:/vcprojects/images/dnn/face/deploy.prototxt";
    String modelBinary = "D:/vcprojects/images/dnn/face/res10_300x300_ssd_iter_140000.caffemodel";
    // 初始化网络
    dnn::Net net = readNetFromCaffe(modelDesc, modelBinary);
    if (net.empty())
    {
        printf("could not load net...\n");
        return -1;
    }

然后要打开本地相机或者一段视频文件，使用VideoCapture对象即可，代码如下：

// 打开摄像头
    VideoCapture capture(0);
    if (!capture.isOpened()) {
        printf("could not load camera...\n");
        return -1;
    }

打开相机成功之后就可以读写每帧图像，然后转换成网络可以接受的数据类型，代码如下：

        // 输入数据调整
        Mat inputBlob = blobFromImage(frame, inScaleFactor,
            Size(inWidth, inHeight), meanVal, false, false); 
        net.setInput(inputBlob, "data");

然后在OpenCV中通过调用net.forward实现检测，对结果提取置信分数(0~1)之间，对大于阈值(假设0.5)的提取BOX位置，就可以绘制矩形框显示了，这部分的代码如下：

// 人脸检测
        Mat detection = net.forward("detection_out"); 
        vector<double> layersTimings;
        double freq = getTickFrequency() / 1000;
        double time = net.getPerfProfile(layersTimings) / freq;
        Mat detectionMat(detection.size[2], detection.size[3], CV_32F, detection.ptr<float>());

        ostringstream ss;
        ss << "FPS: " << 1000 / time << " ; time: " << time << " ms";
        putText(frame, ss.str(), Point(20, 20), 0, 0.5, Scalar(0, 0, 255));
        for (int i = 0; i < detectionMat.rows; i++)
        {
            float confidence = detectionMat.at<float>(i, 2);
            if (confidence > confidenceThreshold)
            {
                int xLeftBottom = static_cast<int>(detectionMat.at<float>(i, 3) * frame.cols);
                int yLeftBottom = static_cast<int>(detectionMat.at<float>(i, 4) * frame.rows);
                int xRightTop = static_cast<int>(detectionMat.at<float>(i, 5) * frame.cols);
                int yRightTop = static_cast<int>(detectionMat.at<float>(i, 6) * frame.rows);

                Rect object((int)xLeftBottom, (int)yLeftBottom,
                    (int)(xRightTop - xLeftBottom),
                    (int)(yRightTop - yLeftBottom));

                rectangle(frame, object, Scalar(0, 255, 0));

                ss.str("");
                ss << confidence;
                String conf(ss.str());
                String label = "Face: " + conf;
                int baseLine = 0;
                Size labelSize = getTextSize(label, FONT_HERSHEY_SIMPLEX, 0.5, 1, &baseLine);
                rectangle(frame, Rect(Point(xLeftBottom, yLeftBottom - labelSize.height),
                    Size(labelSize.width, labelSize.height + baseLine)),
                    Scalar(255, 255, 255), CV_FILLED);
                putText(frame, label, Point(xLeftBottom, yLeftBottom),
                    FONT_HERSHEY_SIMPLEX, 0.5, Scalar(0, 0, 0));
            }
        }

最终运行显示结果如下，脸部无遮挡，正常情况下：

脸部无遮挡，头部倾斜的情况下：

脸部有遮挡的情况下：

更多倾斜、侧脸、模糊等各种情况下：

可见残差网络模型是何等的强大，到这里是不是该点一首《凉凉》送给HAAR级联检测器了。上述demo完整源代码，可以在GITHUB上下载。
https://github.com/gloomyfish1998/opencv_tutorial

OpenCV DNN 教程学习

微信关注我们

原文链接：https://blog.51cto.com/gloomyfish/2094611

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

mysql主从复制读写分离与高可用配置

一、说明前面我们说了mysql的安装配置(并提供一键安装脚本),mysql语句使用以及备份恢复mysql数据;本次要介绍的是mysql的主从复制,读写分离;及高可用MHA;环境如下:master:CentOS7_x64 mysql5.721 172.16.3.175 db1slave1:CentOS7_x64 mysql5.7.21 172.16.3.235 db2slave2:CentOS7_x64 mysql5.7.21 172.16.3.235 db3proxysql/MHA:CentOS7_x64 mysql5.7.21 172.16.3.235 proxysql 架构图: 说明:配置测试时为了方便关闭了防火墙头,selinux安全策略;现实中请开放防火墙策略;myslqdb的安装已经有脚本一键安装并配置好;这里就不在重复配置;只对对应的角色贴出对应的配置或安装与之相关的软件; 二、主从复制配置一台主数据库,N从节点;从节点开启两个线程,通过Slave_IO_Running线程和主节点上有权限的账号从主数据库节点复制binlog日志到本地,能过Slave_SQL_Runn...

2018-04-03

603

一个成熟的数据库架构并不是一开始设计就具备高可用、高伸缩等特性的，它是随着用户量的增加，基础架构才逐渐完善。这篇文章主要谈谈MySQL数据库在发展周期中所面临的问题及优化方案，暂且抛开前端应用不说，大致分为以下五个阶段：阶段一：数据库表设计项目立项后，开发部门根据产品部门需求开发项目。开发工程师在开发项目初期会对表结构设计。对于数据库来说，表结构设计很重要，如果设计不当，会直接影响到用户访问网站速度，用户体验不好！这种情况具体影响因素有很多，例如慢查询（低效的查询语句）、没有适当建立索引、数据库堵塞（锁）等。当然，有测试部门的团队，会做产品测试，找Bug。由于开发工程师重视点不同，初期不会考虑太多数据库设计是否合理，而是尽快完成功能实现和交付。等项目上线有一定访问量后，隐藏的问题就会暴露，这时再去修改就不是这么容易的事了！阶段二：数据库部署是时候运维工程师出场了，项目上线。项目初期访问量一般是寥寥无几，此阶段Web+数据库单台部署足以应对在1000左右的QPS（每秒查询率）。考虑到单点故障，应做到高可用性，可采用MySQL主从复制+Keepalived实现双机热备。主流HA软件...

2018-04-08

791

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。