龙空技术网

用于水上搜索和救援的空中物体检测,航空影像系统特别有用

小三科普官 101

前言:

而今同学们对“图像检测系统”都比较讲究,你们都需要知道一些“图像检测系统”的相关知识。那么小编也在网摘上搜集了一些有关“图像检测系统””的相关知识,希望小伙伴们能喜欢,大家快快来了解一下吧!

摘要

应对水上救援情况具有挑战性,急救人员需要尽快访问数据,以增加成功救援的可能性。使用航空影像系统在搜索和救援方案中特别有用,因为它提供了搜索环境的更高维度视图。

无人机可以很容易地用于获取航空图像数据。在水上搜救场景中,急救人员有时会部署一种称为救援弹浮标的充气标记。浮标配有一个小锥形袋,这可确保标记不会被风吹离航线,而是跟随水体的流动。

跟踪浮标的移动在水上救援中至关重要。科研人员提出了一个新的数据集“VisBuoy”,其中包含真实世界水基环境中的弹浮标标记和船只实例的图像。还展示了如何使用各种基于深度学习的计算机视觉技术,可以自主检测航空图像中的实例。

在“VisBuoy”数据集上比较了四种最先进的物体探测器的性能,以找到最适合此任务的探测器。然后,提出了一个精度得分为74%的最佳模型,可用于搜索和救援行动,以检测水基环境中的充气浮标标记。

介绍

准确及时地访问基于位置的信息是成功搜索和救援行动的关键,最有效的态势感知是通过空中评估实现的。无人机敏捷、快速,可以编程为自主运行,虽然航空数据采集本身有助于在救援场景中获得鸟瞰图,但在处理大量数据以实时识别感兴趣的物体方面存在重大挑战。

作为人类实时处理这些数据并非易事,但是,基于计算机视觉的对象检测模型提供了一种自动搜索此数据以查找感兴趣对象的方法。这对于SAR急救人员可能会有所帮助,他们可以通过足够准确的算法引导无人机数据中可见的感兴趣对象。

对象检测是一种与计算机视觉相关的计算机技术,用于检测数字图像中各种类别的语义对象的实例。SAR任务中感兴趣对象的计算检测非常有用,它消除了手动查看大量数据的需要,并允许在需要时进行自主操作。

在过去,基于深度学习的对象检测模型由于与传统计算机视觉方法相比具有更高的性能而变得突出。卷积神经网络是用于对象检测任务的最新技术,在医学、汽车和太空等许多领域都发挥了巨大作用。

相关工作

近年来,关于将无人机用于SAR的研究很受欢迎。在灾害管理方面已经进行了许多研究,其中无人机技术已经在所有三个灾害阶段进行了探索,灾前准备、灾害评估和灾后响应和恢复。

该研究领域的一个子集包括无人机辅助SAR任务的航空图像捕获工作。具体来说,自动化对象检测的任务已经得到了广泛的探索。方法范围从经典的目标检测方法到现代基于深度学习的方法,后者可实现更准确的检测。

这项研究主要集中在陆地上而不是在水中环境中检测人。研究采用了一种新颖的方法,而是在搜救任务期间通过水基环境中的航空图像检测弹浮标充气标记。

已经有一些关于比较多种最先进的基于航空图像的物体探测器用于车辆和人检测的研究。工作侧重于类似的方法,比较多个探测器以寻找最佳方法,但重点是在水基环境中检测Danbuoy充气标记物的新任务。

数据集生成

使用大疆Mavic Enterprise无人机收集了丹浮标充气标记的自定义数据集。部署了“4号部队SOS充气弹浮标”进入河流环境通过小船。通过多个无人机飞越在不同高度、接近角度和速度下捕获了一段视频,从而产生了实例大小的数据集。

最后,使用视频到图像转换软件将视频分成279,23帧,并使用标签工作室注释工具标记图像。

模型开发

为了通过计算检测充气标记的实例,在 NVIDIA GeForce RTX 80 SUPER 上用 20/2080 的训练验证拆分训练了四个基于 CNN 的模型。编写代码以确保所有方法都可以在平均平均精度和平均召回率指标上相互验证。

并集上的交叉点是评估平均精度时的一个重要概念。IoU 为1表示地面实况和预测边界框完全叠加,而IoU 为0表示预测与地面实况没有重叠,通过查找插值精度召回曲线下的面积来计算平均精度。接下来,通过在每个IoU 级别找到召回率曲线下的面积来计算平均召回率。为了获得平均值,平均所有类的AP/AR。对于AP50 和AP75,将IoU 阈值分别设置为50%和75%。

结合的交集

使用Pytorch训练了四个最先进的模型,如下所示:Faster RCNN,Retinanet,Efficientdet和YoloV5。模型的配置如所述。学习率、优化器、图像大小、周期数和批量大小保持不变,以确保公平比较。每个模型分别使用常用的主干架构。

Faster R-CNN是一个两阶段检测器,它由一个具有区域建议网络的深度全卷积神经网络和一个使用这些建议生成预测的探测器组成。可以通过添加另一个分支来扩展它以返回分割掩码。更快的 RCNN 由于其较大的网络参数大小,推理速度比其他检测器慢。

视网膜是一种单级物体探测器,广泛用于卫星和航空图像。该检测器是作为两级检测器的竞争对手而创建的,例如更快的RCNN,它通常具有更高的精度,但代价是推理速度较慢。它利用焦点损失函数,旨在专注于困难的例子,而不是让简单的例子扭曲探测器。结果是一个比许多两级探测器更快、更准确的探测器。

YoloV5是另一种专为速度而设计的单级探测器,由于其单一网络检测管道,可以进行端到端优化。它比两级探测器更容易出现定位错误,但更擅长避免错误检测,重要的是它可以学习非常一般的物体表示。

Efficientdet 是一款专为提高效率而设计的探测器。它包括一个新颖的双向特征金字塔网络,允许特征融合。它还同时缩放每个网络(骨干、特征、预测)的分辨率、深度和宽度。重要的是,它在COCO上实现了比许多其他SOTA模型更高的AP,尽管(在我们的实验中)参数减少了90%以上。

使用Pytorch闪电,配置了训练管道摄取基于 Hydra的配置对象,以便可以使用相同的底层代码轻松运行不同的模型。编写一个自定义验证循环,以便在MAP指标下轻松比较所有模型。还实施具有权重和偏差的基于云的日志记录,以确保数据来源和可重复性。

评估

训练每个50个epoch的模型,并在每个 epoch 上记录了它们的验证指标我们根据四个标准指标评估了模型,用于最先进的对象检测,MAP、MAP50、MAP75和MAR。如前所述,通过保持一些恒定的配置值,确保了模型之间的公平比较。

计算每个指标的最高分,并根据模型的性能对模型进行排名。发现每个模型在不同的指标下都有优点,四个模型中有三个具有最佳指标结果。

YoloV5在MAR中得分最高,尽管所有模型在MAR指标下都相似,标准差为0.007。在 SAR 场景中,对象检测模型应优先考虑精度而不是召回。高精度是搜救行动的重中之重,因为误报检测可能会阻碍搜救队的工作。

在MAP50指标下,模型再次执行类似的操作。当检测阈值保持在 50% 时,模型更容易被认为是正确的,因此在此指标下很难根据性能将模型分开。Retinanet的表现优于Efficientdet0.89%。

事实证明,在分离模型方面最有用的指标是MAP(所有IoU范围)和MAP75保持在75%IoU。这些指标在每个模型之间的值分布最大,精度是最优先考虑的指标,因为它在 SAR 中的重要性如前所述。Efficientdet是MAP指标下的最佳模型,比Retinanet高出9.58%。Efficientdet在MAP75指标下也是最好的,得分比第二好的模型Retinanet高14%。

如前所述,高精度在搜救行动中非常重要,可以最好地协助第一反应团队,因此,建议使用Efficientdet,因为它在“VisBuoy”数据集上的高精度,有利于Efficientdet的其他一些因素包括其较低的功耗在训练期间和第二高的推理速度与其他型号相比。

型号比较

结论

在本文中,比较四种最先进的物体检测模型在用于水上搜索和救援场景的 danbuoy 充气标记数据集上的性能。该数据集由1,279张图像组成,其中532个浮标实例和387个船只实例。

分析涉及保持一些核心超参数不变(学习率、优化器、图像大小、周期和批量大小),以便在所有检测器之间进行公平的比较。根据标准对象检测评估过程,根据检测器的平均精度和平均召回率对检测器进行排名。

按照数据集上最高性能的顺序对每个模型进行排名,分别为Efficientdet,Retinanet,YoloV5和Faster RCNN。因此,建议将MAP75得分为74%的Efficientdet作为在搜救作业期间从航空图像中检测弹浮标充气标记物的最佳模型。

Efficientdet 还具有额外的好处,即在训练时消耗更少的功率,并且在所有模型中具有第二快的推理速度。通过探索核心超参数常数的不同组合和改变主干,Efficientdet模型在未来的工作中可能会有进一步的改进。

无人机技术已经在SAR工作中有所帮助,在操作过程中提供了鸟瞰图。扩展该技术以添加对生成的大量数据的自动处理并提供精确的基于位置的信息以实时识别感兴趣的对象是有益的。研究表明,Efficientdet是用于水基SAR中弹浮标充气标记物检测的一流检测模型。

●—<参考文献>—●

【1】Beyerer,J.:基于深度学习的航空图像中车辆检测方法的综合评估

【2】S.S.:使用更快的R-CNN和SSD算法在航空热图像中进行人体检测

【3】L.:权重和偏差的实验跟踪

【4】P.:具有人体检测和地理定位功能的无人机搜索和救援场景

【5】S.:在无人机图像中检测人类以进行搜索和救援行动

【6】E.:无人机辅助灾害管理:应用和开放问题

标签: #图像检测系统