龙空技术网

猫脸关键点检测大赛:三种方法,轻松实现猫脸识别

雷峰网 179

前言:

此刻姐妹们对“asm人脸识别算法图解”大约比较关注,咱们都需要知道一些“asm人脸识别算法图解”的相关文章。那么小编也在网上网罗了一些有关“asm人脸识别算法图解””的相关知识,希望姐妹们能喜欢,我们一起来了解一下吧!

今天这个比赛,得从一个做程序猿的铲屎官开始说起......

话说,有一天「铲屎猿」早起之后,发现猫主子竟然没了身影;他找啊找啊,找了好久,可仍然到处都没找到猫主子。这时,客厅突然传来了一声猫叫,铲屎猿循声而至,只见沙发上躺着一个难以辨识的,「东西」?

这东西似猫又非猫,似狗又非狗,铲屎猿眉头一皱,发现事情并不简单!难道这就是喵星人统治世界的第一步:隐藏身份,安能辨我是猫狗吗?

笑话,我等人类岂非尔等猫辈能够打败;想到此处,铲屎猿说道:「看来,是时候展现我猿真正的技术了——绝杀,关键点检测技术!」

绝杀技:关键点检测

没错,铲屎猿口中的关键点检测技术,正是广泛用于计算机视觉任务的基础方法,即通过某些事物的特征关键点,对这些点进行捕捉与识别。

但别看它基础,关键点检测是人脸识别和分析领域中的关键一步,它是诸如自动人脸识别、表情分析、三维人脸重建及三维动画等其它人脸相关问题的前提和突破口。

同时,在表情分析、异常行为检测、美颜换装,甚至是自动驾驶等图像识别类应用领域,该技术也是不可替代的支撑。因此,有了这一技术,铲屎猿就能够设计相应的方案,对这些「狡猾的」喵喵们进行身份确认了~

那要怎样运用这一技术呢?铲屎猿在研究过程中,借鉴了人脸识别的三种方法,它们分别是基于模型的 ASM 方法、基于级联形状回归的 CNN 回归法以及基于深度学习的方法。

一、ASM 人脸识别

该方法也被称为采用主动形状模型(Active Shape Model,简称 ASM)的方法,这是较早出现的关键点检测方法,与大多数统计学习方法类似,包括了 rain 和 test 两部分。

它会对不同形状进行计算机自动标定、校准,运用主成分分析法获取不同形状的模型,然后将模型与实际图形进行灰度匹配,提取像素数目比等特征参数,从而实现人脸识别。

可参考文献:

二、 CNN 回归法

此种方法属于基于级联回归的人脸检测方法。由于卷积神经网络可以用于分类和回归任务,通过利用卷积神经网络,将训练图像划分到多个类别,再采用多层级进行训练,从而对提取的面部关键点,如:左眼、右眼、鼻子、嘴巴进行检测。

值得注意的是,卷积神经网络当用于做回归任务时,最后一个全连接层的输出维度则是要回归的坐标值的个数,同时,其采用的是也欧几里何损失 Euclidean Loss。

可参考文献:

三、深度学习方法

随着神经网络的迅速发展和其对图像数据的强大的特征提取,深度学习运用于人脸识别也取得了很好的效果。其中,LFW 数据集(Labeled Faces in the Wild)是目前用得最多的人脸图像数据库。

该方法的核心内容为首先将图片中的人脸检测处理并通过关键点进行对齐,然后通过一定方法将得到的关键点数据输入到神经网络,得到特征向量,再之后利用分类训练过程,则可得到人脸的特征向量。

参考论文:

除了拯救喵喵,还能照顾喵喵

研究清楚关键点检测的技术原理之后,铲屎猿将人脸的关键点换为了猫脸的关键点,包括:猫眼睛、鼻子、嘴巴、耳朵等特征;经过一系列实验,终于开发出了可用于检测猫脸的方法。猫脸检测后的效果如下:

同时,这一工具不光可以对猫的身份进行了检测确认,同时它还设计了更多贴心的功能,可以检测咪咪的毛发、五官神态、精神状态等,从而更好的了解咪咪的健康状况。

除此之外,铲屎猿还计划将来能够开发出检测咪咪活动、进食、玩耍、如厕等数据的工具,等到那时,咪咪们可就不能造反了哦~

猫脸检测大战,开炮

但令铲屎猿万万没想到的是,在能够确认自家咪咪身份的时候,喵星人危机已经大量爆发于世界各地。

为了防止世界被破坏,为了维护世界的和平,AI 研习社()特邀天下程序猿星人,共同开发识别性能更强、准确度更高的猫脸检测工具,来让这些待识别的猫主子被认领回家~

本次大赛「猫脸关键点检测」的目标是检测猫脸的 9 个关键点。相关的数据集训练集有 10468 张,测试集 9526 张。其中训练集每张图都对喵喵的 9 个关键点进行了标注,标注信息为坐标信息。

开始时间:2019-12-19 09:00:00

结束时间:2020-01-18 00:00:00

大赛还提供了免费云训练 GPU 资源,以及基础奖金池为 2000 元哦~比赛一共设置了三种奖项,包括了:参与奖(30%)、突破奖(20%)、排名奖(50%)。

三种奖项互不冲突,拯救地球的同时,再赚他个千来块,岂不是也能买好多杯奶茶了呢!

数据集下载链接:

评审标准

最终提交结果文件如下所示,其中,第一个数据为测试集图片 ID(即文件名);后面的 18 个数据为 9 个关键点(每个关键点对应两个数据),每一行共包含 19 个数据。

Ps:建议使用 UTF-8 编码,提交前请确认结果文件预测样本数量共计 9526 条,因为数量不足可能导致无法评分哈~

整个比赛的评审完全透明化,我们将会对比选手提交的结果文件,按照如下公式计算得分,其中:

MAE:平均绝对误差,可以更好地反应预测与实际结果的误差情况。

每日 24:00,我们也会将最新结果更新在官网排行榜上。是猫还是狗,你说了算!

更多信息,可进入参赛主页查看,快让你的大名出现在拯救地球榜单上吧:

雷锋网 AI 开发者 雷锋网雷锋网

标签: #asm人脸识别算法图解