《中国人工智能学会通讯》——11.49 异质人脸图像合成及其应用研究
11.49 异质人脸图像合成及其应用研究
安城市和智慧城市建设构建了大量的视频监控网络,从而获得了大量的视频以及图像数据。基于这些图像和视频数据,可以利用模式识别技术进行事件分析和身份认证。传统的模式识别方法利用传感器将将现实世界的感兴趣的目标进行图像采集,从而在信息空间中进行目标识别,构建一个基于物理 - 信息空间融合的自动模式识别系统。然而由于视频监控中感兴趣的目标(人或物)成像分辨率低或刻意隐藏身份(伪装、遮挡、侧面、光照等因素),导致传统的基于两元空间(物理空间和信息空间)的模式识别方法效果受到限制。
在辅助公共安全技术部门侦破案件的实践中我们发现,在以上的两元空间框架下引入第三元空间——人类认知,将会大大提高破案成功率和效率。以人脸识别为例,公共安全中经常遇到的场景有:① 安装摄像头时为了捕捉尽量大的视角范围往往采用广角摄像头,但当人脸距离摄像头较远时,获得的图像或视频序列分辨率比较低(可能低于16像素×16像素值)[1] ,给机器模式识别带来挑战[2] ;② 由于嫌疑人的刻意躲避,监控摄像头拍摄到的图像、视频可能是侧面或完全没有面部,或者受强烈的光照影响等。针对以上场景,法医刑警可以根据视频或者图像来绘制模拟画像(存在视频或图像数据的情况下),或者根据目击者描述来绘制模拟画像,从而通过人的认知将主要的信息提取出来并补充缺失的信息,去除分辨率低、光照影响以及信息缺失带来的挑战。得到模拟画像后,到公安部门的公民可见光图像数据库中进行检索匹配以确定犯罪嫌疑人身份。这样,就形成了基于三元空间融合的人脸图像识别模型。
由于画像和照片在纹理上的不同,使得传统的人脸识别方法难以直接使用。为了减小异质图像间的差异,人们常常通过异质图像的变换将这些不同模态的图像转化为相同模态。以画像和照片为例,我们既可以将照片转换为对应的画像,也可以将画像转换为相应的照片,从而实现异质图像间的变换与合成。对于其他异质图像也存在类似的转换关系。本文将以人脸画像 - 照片间的相互转换为例来介绍现有异质人脸图像的合成方法。事实上,由照片合成画像和由画像合成照片是两个对偶的过程,因此只需要交换其中画像和照片的角色即可得到另一合成过程。