硬核科普:人脸识别系统 帮你把脸刷明白(3)
扫一扫
分享文章到微信
扫一扫
关注99科技网微信公众号
01 常用数据库
常用的人脸检测数据库包括:FDDB[6]和WIDER FACE[4]。
FDDB
FDDB是全世界最具权威的人脸检测评测数据库之一,数据集完全公开,一共有2845张图像,5171个人脸标注。包括不同姿势、不同分辨率、旋转和遮挡等人脸图片,同时包括灰度图和彩色图。图像分辨率较小,所有图像的长边缩放到450像素,也就是说所有图像都小于450*450,最小标注人脸大小20*20。绝大多数图像都只有一个人脸。
WIDER FACE
一共有32203张图像,393703个人脸标注,分训练集(train)/验证集(val)/测试集(test),分别占40%/10%/50%。数据集包括各种尺度,姿态,遮挡,表情,化妆,光照等人脸图像,难度较大。图像分辨率普遍偏高,所有图像的宽都缩放到1024,最小标注人脸大小10*10,都是彩色图像;平均12.2个人脸/图,密集小人脸多。
WIDER FACE不公开测试集的标注结果(GT:ground truth),需要提交结果给官方评测,结果公平公正,而且测试集大,可靠性高。根据EdgeBox方法的检测率WIDER FACE评测集被划分为三个难度等级:Easy, Medium, Hard。算法可以在各个任务维度上进行评测,比如Hard等级非常适合评测小人脸。
02 常用评价指标
二分类问题最常用的评测指标是准确率和召回率:
准确率(Precision)代表着预测为正的样本中有多少是正样本;
召回率(Recall)代表着总的正样本中有多少被成功预测出来(预测为正)。
下面举例来说明如何计算准确率和召回率。这里假设测试集中有100个正样本和100个负样本,100个正样本有90个被正确预测为正,10个被错误预测为负;100个负样本中有80个被正确预测为负,20个被错误预测为正:
TP(true positive)代表着正样本被正确预测为正的数量,于是TP=90;
99科技网:http://www.99it.com.cn
