龙空技术网

基于稳健排列的真实图像上的眼镜检测

朱竟年 140

前言:

现在同学们对“lbp算法计算”可能比较看重,大家都需要分析一些“lbp算法计算”的相关知识。那么小编同时在网上搜集了一些关于“lbp算法计算””的相关内容,希望咱们能喜欢,小伙伴们一起来学习一下吧!

自动人脸识别是一个引人注目的研究问题,因为它在实际应用中具有巨大的潜力,然而,稳健的人脸识别并非易事,遮挡物(如戴眼镜)会降低自动人脸识别系统的性能。

在某些情况下,特定的眼镜可以识别一个人,而在其他情况下,它们可以作为人物识别的软生物特征(如黑客帝国的眼镜、U2乐队的眼镜),自动性别识别面临与人脸识别相同的问题。

然而,男性眼镜和女性眼镜之间存在一定的外观差异,这可以帮助区分一个人的性别,甚至,与年长者相比,年轻人的眼镜外观可以提高自动年龄分类算法的性能,而不是降低它的性能。

许多安全系统要求佩戴眼镜,使用眼镜是强制性的,智能广告和市场营销也可以利用这一点,同时眼镜可以提供有价值的信息。

例如,眼镜可以揭示一个人在特定时间正在做什么活动(安全眼镜、运动眼镜、滑雪眼镜、太阳镜、水下眼镜、潜水面罩、阅读眼镜、眼镜、谷歌眼镜等)。

对面部图像中的眼镜进行自动识别需要进行深入研究。图1显示了真实图像中不同类型的眼镜,眼镜框架的固有外观变化甚至不容易区分(图1d),这使得这是一个具有挑战性的问题。

进一步的挑战包括不同类型的眼镜:运动眼镜(图1a、b、h)或太阳镜(图1g、i)、不同的尺寸(图1e、f)、反射和闪光(图1c)或面部图像的旋转(图1d)。

图1真实图像中不同类型的眼镜

眼镜检测、提取和移除的方法

基于图像处理的方法:这些方法利用图像的颜色、纹理、形状等特征进行眼镜检测和提取。

这种方法的优点包括:相对简单和高效,不需要额外的设备或传感器;可以在普通的2D图像上进行操作,适用于常见的摄像头和图像采集设备;可以通过对眼镜区域进行分析和处理,进一步应用于人脸识别、属性分析等应用。

基于深度学习的方法:这些方法利用深度神经网络对眼镜进行检测和提取。

其优点包括:具有较高的准确性和鲁棒性,能够处理各种类型和形状的眼镜;可以通过训练大规模的数据集来提高性能,并具有一定的泛化能力;可以处理复杂场景下的眼镜检测,如遮挡、光照变化等。

基于三维信息的方法:这些方法利用三维视觉系统获取的眼镜的空间信息进行检测和提取。

它具有以下优点:可以利用眼镜在三维空间中的形状和位置信息来进行准确的检测和提取;对于具有复杂形状的眼镜,如曲线边框或异形眼镜,具有较好的适应性;可以通过获取额外的深度信息来提高眼镜检测和提取的精度。

基于统计和机器学习的方法:这些方法利用统计模型和机器学习算法对眼镜进行检测和提取。

优点包括:可以通过建立适当的特征和模型来实现高效的眼镜检测和提取;可以根据特定的应用场景和数据集进行模型的定制和优化;可以结合其他方法,如图像处理、深度学习等,进行更加准确和鲁棒的眼镜检测和提取。

人脸识别算法中的对齐

人脸识别算法中的对齐步骤通常被忽视或没有详细说明,在某些情况下,对齐是通过手动标记眼睛位置来完成的,在其他情况下,这一步骤被忽略,认为人脸检测算法会执行某种形式的对齐。

许多识别算法在进行识别之前依赖于将人脸区域准确定位到一个规范姿势中,这种对齐过程可以提高对真实图像的识别准确性,即使对于对齐不敏感的算法也是如此。

目前有人提出了一种使用对齐不良的类别示例来生成该对象类别的对齐模型的方法,也有人使用无监督的联合对齐和无监督的特征学习的组合来对齐图像。

目前一种基于眼睛检测的人脸归一化算法被提出,该算法通过检测人脸图像中瞳孔的位置,然后对人脸图像的方向、尺度和灰度进行归一化处理,人脸区域根据嘴的位置进行调整。该算法的缺点是需要定位瞳孔的位置,因此眼镜和部分遮挡可能会改变归一化步骤的结果。

在另一种被提出的人脸归一化算法中,眼睛在人脸中手动定位,然后将人脸旋转和对齐,使得每张人脸的眼睛位于相同的位置,在归一化步骤之后,图像被缩放到固定尺寸。

下面将介绍一种人脸对齐和归一化算法,为了获取错位角度,该算法基于眼睛的四个点计算回归线,虽然有一些自动人脸特征点检测器,但这种算法中使用的人脸地标检测器在外观和结构分布上利用了人脸的一些特征之间的关系(眼睛、鼻子和嘴巴)。

这样,相较于其他算法,该算法可以估计出有遮挡情况下眼睛的位置(如戴眼镜或太阳镜)。

算法简介

在图2中,可以看到该算法的主要步骤,下面将对其进行讨论。首先,该工作使用Viola和Jones的算法来定位人脸。在图像中定位到人脸之后,需要进行一些预处理以处理姿势、旋转、尺度和定位人脸的不准确性,然后应用人脸归一化算法来获取眼睛周围的区域。

之后,应用LBP和RobustLBP来获取特征集,最后,在分类步骤中应用支持向量机(SVM)。

SVM被用于对归一化的眼镜区域中提取的特征直方图进行分类,SVM分类器的输出是一个二分类问题,即有眼镜和无眼镜。

因此,不同类型的眼镜(运动眼镜、太阳镜、安全眼镜、阅读眼镜等)属于同一类别。SVM是一种对数据进行分类的有用技术,在许多模式识别任务中已被证明是有效的,包括人脸和面部识别,LIBSVM常被用于SVM的训练和测试。

图2算法主要步骤

面部对齐和规范化

在这个步骤中,研究人员选择用地标的关系来估计眼睛的位置,当由于遮挡(如戴眼镜或太阳镜)无法可靠地测量眼睛的形状或强度特征时,上下文特征对于眼部定位非常有用。

这是因为在面部上下文中,眼睛通常与其他面部特征具有稳定的关系,无论是在外观还是结构分布上。因此,为了检测面部的主要点位以及眼睛的位置,采用了通过结构化输出SVM学习的面部标记检测器。

分类器的输入是一个固定尺寸的静态图像,其中包含一个人脸。分类器的输出是一组面部标记的估计位置。

图3a展示了考虑了八个组件的图形约束。每个面部特征在一个矩形窗口上计算,如图3b所示。分类器的准确性已在LFW数据库上进行了测试,检测器能够对大约97%的图像进行估计,估计位置与真实位置的均一化偏差小于10%。

为了说明这一度量指标,展示了两个样本图像(见图3c、d),其中估计的标记位置的均一化偏差平均值为10%。

图3分类器示例

主要步骤总结如下:首先获得八个面部地标,然后为了得到错位的角度,根据四个点计算回归线:左眼和右眼的眼角,即左内眼、左外眼、右内眼和右外眼(见图4)。之后,在图像中对脸部进行旋转和对齐,使眼睛在所有图像中都位于相同的坐标上。

眼睛周围的区域在源图像中被计算出来。一旦计算出旋转图像中眼镜区域的角的坐标,就从旋转的图像中裁剪出结果区域。

图4计算回归线

局部二进制模式

局部二进制模式(LocalBinaryPatterns,简称LBP)是一种用于图像处理和模式识别的特征描述算法。LBP算法通过将图像的像素值与其邻域像素值进行比较,并根据比较结果生成二进制编码。这些二进制编码可以用来表示图像的纹理信息和局部结构。

LBP算法的基本步骤如下:首先选择一个像素点,并定义其邻域范围,然后将邻域内的像素值与中心像素值进行比较,如果邻域像素值大于或等于中心像素值,则将该位置的二进制编码位设为1,否则设为0。

接着将邻域内的二进制编码按顺时针或逆时针方向排列,形成一个二进制数,并将生成的二进制数转换为十进制数,作为中心像素点的LBP编码值。

LBP算法的优点包括以下几点:

简单而高效:LBP算法的计算过程简单,不需要复杂的数学运算,因此计算速度较快。

不受光照变化影响:LBP算法对图像的光照变化具有一定的鲁棒性,能够有效地提取纹理信息。

不受几何变化影响:LBP算法对图像的旋转、缩放等几何变化具有一定的不变性。

由于LBP算法的优点,它在许多图像处理和模式识别任务中被广泛应用,如人脸识别、纹理分析、行人检测等。

图5展示了LBP的编码过程。

图5LBP编码过程

圆形局部二进制模式(CircularLocalBinaryPatterns,简称CircularLBP)是LBP算法的一种变体,它在LBP的基础上使用了固定的圆形邻域模式来生成特征描述。

在圆形LBP中,与传统LBP不同的是,邻域的采样点位置不再是正方形的,而是以中心像素为圆心,均匀分布在一个圆周上的采样点。具体步骤如下:

首先选择一个像素点作为中心点,并定义邻域半径和采样点个数,然后将邻域半径等分成采样点个数份,确定每个采样点相对于中心点的位置。

接下来对于每个采样点,将其像素值与中心像素值进行比较,如果采样点的像素值大于或等于中心像素值,则将对应位置的二进制编码位设为1,否则设为0。

最后将生成的二进制编码按照顺时针或逆时针的顺序排列,形成一个二进制数,并将二进制数转换为十进制数,作为中心像素点的圆形LBP编码值。

圆形LBP相比于传统LBP,在保留了LBP算法的优点的同时,能够更好地描述图像的局部纹理特征。它对于光照变化和噪声的鲁棒性更强,且能够更好地捕捉到图像中的细节信息。因此,圆形LBP常被用于人脸识别、纹理分类、物体检测等任务中。

图6是一个圆形LBP的示例。

图6圆形LBP示例

总结

自动眼镜检测在安全系统、智能广告和营销等领域具有广泛的潜在应用。研究人员探索了在真实人脸图像上进行眼镜检测的方法,并提出了一种归一化的眼镜区域。他们对原始的LBP(局部二进制模式)和RLBP(鲁棒局部二进制模式)使用了不同的α参数进行了比较。

此外,他们还研究了分辨率、归一化图像的排列以及LBP算子的划分数量等因素对眼镜检测的影响。

结果显示,这种简单而有效的算法在LFW数据库中获得了令人印象深刻的分类精度,达到了98.65%的识别率。

该算法还在FERET数据库上进行了测试,取得了99.89%的识别率。同时还表明该算法在广泛的光照条件和不同的姿势下具有稳健性,并且能够处理遮挡问题,例如太阳镜。即使脸部的主要特征没有被正确提取,该算法仍能相当稳健地估计眼镜区域。

除了眼镜检测,上述描述中提到的归一化眼镜区域还可以用于处理眼睛亲近度检测问题,在面部图像中的眼睛亲近度检测具有广泛的应用,如面部表情识别和司机疲劳检测等。

最近,还发布了野外闭眼(CEW)数据库。未来的工作包括开发一个能够同时解决眼镜检测和眼睛亲近度检测的架构,使用LFW和CEW数据库以及新的模型和描述符,以获得更好的图像特征,在不牺牲简单性的前提下实现更好的识别性能

同时为了提高算法的通用性,将结合不同的数据库并进行一些验证,以建立一个真实且尽可能没有偏见的数据库。该数据库将包含不同类型的眼镜(如运动眼镜、太阳镜、安全眼镜、阅读眼镜等),用于测试眼镜检测和识别的性能。

参考文献:

FernándezA,GarcíaR,UsamentiagaR,etal.Glassesdetectiononrealimagesbasedonrobustalignment[J].MachineVisionandApplications,2015,26:519-531.

标签: #lbp算法计算