龙空技术网

基于口型图像的犬类识别方法

纸上点将 130

前言:

如今咱们对“图像二值化app”可能比较看重,咱们都想要了解一些“图像二值化app”的相关内容。那么小编也在网络上搜集了一些关于“图像二值化app””的相关资讯,希望你们能喜欢,你们快快来学习一下吧!

人体生物特征识别旨在根据每个人独特的某些生理或行为特征为个体分配唯一身份,这些独特特征基于指纹、虹膜、面部和其他特征,通常被称为生物特征模态、标识符或特征。

人体生物特征系统通常包括四个主要阶段:预处理、特征提取、匹配和后处理。预处理阶段通常包括图像增强(例如对比度拉伸、低通滤波等)。

特征提取阶段通常提取识别个体的独特特征,并引入和应用了各种特征提取算法。匹配阶段将从两个不同图像中提取的特征进行匹配,并根据提取特征的格式选择适当的匹配算法。后处理阶段通常包括减少噪声和改善结果的方法。

将人体生物特征应用于动物是动物识别领域的一项有前途的技术,与人体生物特征类似,动物的虹膜、面部和口鼻图案可用于个体识别。在各种生物特征识别标识符中,口鼻图案是一种特殊的标识符,仅适用于某些动物,如牛、狗等。

口鼻图案研究始于1921年,被视为类似于人类指纹的独特动物识别符。最近,已提出了几种基于图像的口鼻图案识别系统,其中大多数是用于个体牛的识别。

从先前的牛口鼻图案识别研究中,已证明了著名的通用特征提取算法(如尺度不变特征变换(SIFT)和加速鲁棒特征(SURF))可以从个体口鼻图案图像中提取独特特征的可靠解决方案,然而,尚未有研究回答哪种算法对于口鼻图案识别更为合适。

此外,尽管已提出了各种牛口鼻图案识别方法,但尚未进行针对狗的研究。

口鼻图案相关研究

目前还没有关于狗口鼻图案识别的研究,但是已经有一些口鼻图案识别方法被提出,以下是一些常见的口鼻图案识别方法:

二值化和形态学处理:将口鼻图像进行二值化转换,并应用形态学处理来提取关键像素作为特征。其优点在于简单易实现,可以提取口鼻图案中的关键像素,但可能无法捕捉到复杂的图案信息,此外也对噪声和变形敏感。

特征脸算法:应用特征脸算法进行口鼻图案的辨识,该算法通过提取主要的特征向量来表示口鼻图案,并进行匹配。其优点在于可以捕捉到整体的口鼻图案特征,适用于大规模数据集,但也有着对光照变化和尺度变化敏感,计算复杂度高的不足。

尺度不变特征变换(SIFT):利用SIFT算法从口鼻图像中提取关键点和描述符,以捕捉图案的局部特征,并进行匹配。具有尺度不变性和部分旋转不变性,以及对光照和视角变化较稳健的优点,但也有着计算复杂度较高,可能需要大量存储空间的缺点。

速度增强稳健特征(SURF):类似于SIFT,SURF也是一种用于提取口鼻图案的局部特征的算法,具有更快的计算速度。相对于SIFT,它的计算速度更快,对尺度和旋转变化具有较好的稳健性,但可能对视角变化和噪声敏感,导致会损失一些细节信息。

二进制稳健不变缩放关键点(BRISK):BRISK是一种用于提取口鼻图案的特征点的算法,它具有二进制描述符,并对尺度变化具有不变性。其计算速度较快,对尺度变化具有较好的稳健性,但同时对于旋转和光照变化敏感,可能会损失一些细节信息。

旋转BRIEF(ORB):ORB是一种具有旋转不变性的特征提取算法,适用于口鼻图案的识别。它计算速度较快,对尺度和旋转变化具有较好的稳健性,适用于实时应用,问题在于可能对光照变化和视角变化敏感,有些细节信息会丢失。

数据获取

狗的口鼻图案与牛类相似,但尺寸要小得多。

由于狗的口鼻图案较小,即使是在小幅度移动中,也会获取到模糊的口鼻图案图像,然而,由于相机技术的进步,人们能够获得足够质量的口鼻图案图像用于个体识别。

研究人员们使用了一台具有6M像素单色相机和液态镜头的设备,图1a显示了用于获取口鼻图案图像的设备。

图1获取狗嘴部图像的装置与感兴趣的区域

口鼻图案图像来自11只狗(5只贵宾犬,4只马尔济斯犬,1只狮子狗,1只约克夏),拍摄距离约为10-15厘米。为了避免直射阳光的光反射,图像获取过程在室内进行。拍摄图像后,只从获取到的图像中分割出对狗的识别更有信息的感兴趣区域。

该区域被称为感兴趣区域(ROI),ROI被定义为包含鼻孔边界的最大矩形,在鼻尖区域,ROI在图1b中显示。

数据筛选

图2舍弃的图像

由于室内光线和狗的移动,获取到的图像中包含了许多不适合进行狗的个体识别的不恰当图像,如图2所示。作为个体识别的第一步,有必要选择没有光反射并且清晰度较高的合适图像。

首先,使用直方图来排除存在光反射的图像。狗的鼻子区域通常较暗,因此亮度值较低。而光反射的区域则具有较高的亮度值,对带有光反射和没有光反射的图像进行了手动检查直方图。

经过手动检查后,确定将直方图中在150到255之间有超过200个像素的图像丢弃,光反射和没有光反射的图像的直方图如图3所示。

图3(a)光反射;(b)无光反射

然后,进行了模糊图像筛选,对ROI图像应用直方图均衡化以增强清晰度,然后使用Haar小波变换算法进行了模糊检测。未能通过算法适当阈值的图像被确定为模糊图像,然后被丢弃。

此次设置的阈值为50,经过所有处理,从11只狗中每只狗选取5张图像,组成了一个由55个ROI图像组成的数据集。ROI图像的尺寸从最小的290×280像素到最大的841×825像素不等,平均为549×515像素,该数据集被称为原始测试数据集。

数据增强

数据增强通常用于证明系统的鲁棒性,为了评估所提出算法的鲁棒性并找到适合狗口鼻图案识别的特征提取算法,使用了原始测试数据集进行了图像变形的数据增强。

图像变形考虑了在狗口鼻图案图像获取过程中可能出现的因素,在获取狗口鼻图案图像时,可能发生角度、照明(亮度)、噪声和透视等变化。

研究人员从一张原始图像中创建了18个图像变形图像,其中,通过将角度从-15°到15°以5°间隔变化制作了六个图像。

通过在所有像素值中添加25、50、75和100,考虑到高亮度环境,制作了四个图像。通过添加垂直运动模糊、水平运动模糊、高斯模糊和椒盐噪声,制作了四个图像。

最后,通过上、下、左、右四个透视变换制作了四个图像。因此,数据集共有1045个图像,其中包括55个原始图像和990个变形图像。

图4展示了一个图像的测试数据集示例。该数据集被称为增强测试数据集。因此,此时存在两个测试集:(1)只包含原始图像的原始测试数据集,(2)通过上述增强过程获取的增强测试数据集。

图4一个图像的测试数据集示例

提出方法

提出的方法如图5所示。对于输入的ROI图像,应用预处理以增强口鼻图案图像,使其尽可能匹配。然后,使用通用的特征提取算法进行特征提取。

图5方法框图

通过从口鼻图案图像提取的特征描述符,进行匹配,最后,应用后处理以减少不正确的匹配。

该过程的输出是每两个给定图像之间的良好匹配数量。所有的口鼻图案图像都被转换为灰度,并通过所提出的方法进行处理,算法是使用Python3和OpenCV3.3实现的。

原始测试数据集的大小范围从最小的290×280像素到最大的841×825像素不等,大小差异可能会降低狗的识别性能,狗的口鼻图案比牛小得多,因此对图像调整大小可能更敏感。

如果在调整图像大小时改变原始图像的宽度和高度比例,口鼻图案可能会变形,如果图像调整得太大或太小,会发生信息丢失,变形和信息丢失可能会导致狗的识别性能下降。

因此,研究人员们通过保持原始图像的宽度和高度比例来进行图像调整大小,并选择参考值来最小化实验中的信息丢失。

有限对比度自适应直方图均衡化(CLAHE)

直方图均衡化是一种利用图像中像素值的累积分布函数进行图像增强的代表性方法。由于一般的均衡化增加整个图像的对比度,效果通常不令人满意。先进的直方图均衡化方法被称为CLAHE。

CLAHE将图像分成小区域,并通过使用对比度限制去除极端噪声来对每个区域内的直方图进行均衡化。因此,它对暗区域增强的对比度更高,对亮区域增强的对比度较低。

狗的口鼻图像的对比度通常较低,因为狗的鼻子通常较暗,并且由于照明条件的不同,即使对于同一只狗,图像之间的对比度也会有所不同。低对比度和对比度差异会降低狗的识别性能。

因此,研究人员通过反复应用CLAHE直到直方图足够拉伸,以减小图像之间的对比度差异并增强对比度。CLAHE会重复应用,直到直方图中0-49和206-255范围内的像素超过1000个。

特征提取算法

诸如SIFT、SURF、BRISK和ORB之类的通用特征提取算法已被证明适用于对象识别。它们各自具有自己的优势。为了找到哪种算法更适合狗的口鼻图案识别,将SIFT、SURF、BRISK和ORB应用于所提出的方法,从口鼻图案图像中提取唯一的特征。

特征提取算法包括关键点检测器和描述符,检测器在图像中找到关键点,描述符生成描述相应关键点的信息。在算法的实现中,使用OpenCV3.3的默认值作为算法的所有参数。

SIFT是一种解决Harris角点技术问题的算法,该技术对图像的尺度变化敏感。

SIFT创建不同的图像尺度空间,并使用高斯差分(DoG)检测器在空间中找到最大的角点作为关键点,对于每个关键点,从像素的局部邻域中的梯度幅值和相对方向计算描述符。SIFT对图像的尺度变化具有鲁棒性,但计算成本较高。

URF是一种在检测关键点和生成描述符过程中使用积分图像的算法,以减少计算量。

SURF与SIFT类似,它从检测到的关键点中提取主导方向的角度,并将梯度信息用作子区域中的表达向量。SURF使用Hessian矩阵来找到关键点。

ORB是一种结合了加速分段测试(FAST)和二进制鲁棒独立元素特征(BRIEF)算法的算法。

FAST通过将亮度值与一定半径内的相邻像素进行比较来检测关键点。

BRIEF是一种二进制描述符,它根据中心像素基于统计随机距离来比较两个像素的强度。

ORB通过将关键点的主方向角添加到二进制描述符中,对图像的旋转具有鲁棒性。

BRISK是另一种二进制描述符,它改进了BRIEF的概念。BRISK围绕关键点取四个同心区域,并根据高斯平滑将它们划分为任意的圆形采样区域。然后,根据所有划分的圆形区域中的亮度构建二进制描述符。

最后FAST被用作关键点检测器,BRISK结合FAST对图像的旋转和尺度变化具有鲁棒性。

匹配

匹配算法通过计算特征提取算法提取的特征描述符之间的距离,将其进行匹配,并输出好匹配的数量,好匹配的数量被用作确定是否属于同一只狗的阈值。FLANN匹配算法主要用于向量描述符匹配,因此用于SIFT和SURF描述符的匹配。

在FLANN的实现中,FLANN的阈值对于SIFT和SURF都设为0.8,Hamming距离主要用于二进制描述符的匹配,因此用于ORB和BRISK。在Hamming距离的实现中,ORB的阈值设为64,BRISK的阈值设为90。

结论

主要提出了一种基于ORB方法的狗鼻图案识别的新型狗身份验证方法,该方法由三个关键技术组成:改进的调整大小方法、改进的CLAHE方法和重复匹配移除方法。

改进的调整大小和CLAHE方法在提高同一狗图像的图像匹配性能方面发挥了关键作用,而重复匹配移除方法在不同狗图像的匹配中减少了不匹配的情况。与基于通用特征提取算法的牛鼻识别的基本方法相比,该方法在狗鼻图案识别的性能上有显著改进。

上述提出的方法在狗身份识别方面的性能已经足够好,可以进一步进行研究,未来将使用更多的狗进行评估,并测试其他预处理方法(如噪声过滤)以提高性能。

此外,将研究自动图像获取方法,以提供更实用的解决方案。狗的鼻子和鼻口部图案要比牛小得多,因此很难获取适当的狗鼻图案图像。

因此,为了发展狗鼻图案识别,有必要开发一种能够检测狗的鼻子、分割感兴趣区域鼻口图像并过滤不适当图像的自动系统。通过进一步的研究,希望该方法能够被用作狗注册的方法,并为减少丢失或被遗弃的狗做出贡献。

参考文献:

Jang,D.-H.;Kwon,K.-S.;Kim,J.-K.;Yang,K.-Y.;Kim,J.-B.DogIdentificationMethodBasedonMuzzlePatternImage. Appl.Sci. 2020, 10,8994.

标签: #图像二值化app