b.CK+一个是人脸表情数据集(CK+,Extended Cohn-Kanade Dataset,~emotion/ck-spread.htm ),包含固定表情和自发表情,包含123个人的593个表情序列。每个序列的目标表情被FACS编码,同时添加了已验证的情感标签(生气、厌恶、害怕、快乐、悲伤、惊讶)。 3、需要说明“有效距离,左右角度,上下角度,速度”等参数值(范围) 注:这和“部署的灵活性”相关——由于不同客户不同场景的需求不同,所以技术方的人脸检测模块,一般可以通过调整参数得到N种亚型,以适应不同应用场景(光照、角度、有效距离、速度) 下对运算量和有效检测距离的需求。 4、需要知道的是,很多公司刷榜的数据,更多是PR效果 UCLA的@朱松纯 教授 在文章《浅谈人工智能:现状、任务、构架与统一 | 正本清源》里就提到: 咱们刷榜比打乒乓球还厉害,刷榜变成咱们AI研究的“国球”。所谓刷榜,一般是下载了人家的代码,改进、调整、搭建更大模块,这样速度快。我曾经访问一家技术很牛的中国公司(不是搞视觉的),那个公司的研发主管非常骄傲,说他们刷榜总是赢,美国一流大学都不在话下。我听得不耐烦了,我说人家就是两个学生在那里弄,你们这么大个团队在这里刷,你代码里面基本没有算法是你自己的。如果人家之前不公布代码,你们根本没法玩。很多公司就拿这种刷榜的结果宣传自己超过了世界一流水平。 四、人脸识别的现状 1、实验室效果和现实效果对比 1)实验室训练数据和实际抓拍数据
大多数情况下,实际抓拍图像质量远低于训练图像质量。由于训练数据普遍是由用户经过手机app/web采集上来的图片,所以光照、角度、模糊程度都可以由产品控制,但是实际抓拍图片质量是和实际场景中的光线、摄像头分辨率等等因素相关,照片质量比较难把握。 在上图的情况下,即使算法模型可以达到很高的精确度,但由于抓怕图片质量不好的原因,实际效果会大打折扣甚至不可用。 这种情况的解决办法是: 对摄像头进行补光/滤光 将摄像头固定在角度合适的位置 算法在识别前进行图像预处理 2)训练时的标准和实际应用的标准 大多数情况下,实际应用的标准会远高于训练标准。例如,人脸识别实验室的标准是通过正脸数据训练出模型,能识别正确人脸就可以。而实际情况可能没有正脸数据,对训练提出了更高的要求。 3)训练效果和现实效果 大多数情况下,实际效果会远低于训练效果。现在市面上CV公司都是说自己的训练效果在99%以上(无限接近于100%),但这不等于实际应用的效果就是99%。工业上场景复杂的人脸应用(类似识别黑名单这种1:N的人脸比对)正确率在90%以上就已经是表现得很好的算法模型。 2、算法漏洞常被利用破解人脸识别系统 人脸识别常常被质疑是否安全性不够高,很多人脸识别的产品都能被破解。比如长得比较像的人可能会被误认为同一人;用录入人员的照片或者视频也能通过人脸系统。
而现在安全性能比较高的系统一般是人脸识别技术和其他生物识别技术相结合,例如人脸识别+指纹识别;人脸识别+虹膜识别等等。 以上所有内容,就是本次对人脸识别的梳理。文章参考了大量文献,也结合了本人的实战项目经验,希望能通过这样体系化的梳理让大家有所收获。也非常欢迎大家和我沟通对人脸识别的见解和看法。 附:参考文章 《人脸面部特征提取技术的研究》 《人机交互中的人脸表情识别研究进展》 《基于深度学习的人脸识别技术综述》 《人脸识别之端到端的框架(二)—DeepID》 (责任编辑:admin) |