龙空技术网

光谱检测基于亲和力驱动嵌入的矿石光谱数据挖掘与分类

瓜汁橘长Dr 94

前言:

现时兄弟们对“在数据挖掘的分类算法中比较典型的算法是”可能比较讲究,小伙伴们都需要知道一些“在数据挖掘的分类算法中比较典型的算法是”的相关文章。那么小编在网上汇集了一些有关“在数据挖掘的分类算法中比较典型的算法是””的相关知识,希望兄弟们能喜欢,各位老铁们一起来了解一下吧!

在阅读此文前,麻烦您点一下关注,方便以后的讨论和分享,感谢支持~

文|瓜汁橘长Dr

编辑|瓜汁橘长Dr

引言

由于不需要特征工程,深度学习方法被应用于光谱检测,设计了深度神经网络模型,对矿石的激光诱导击穿光谱进行数据挖掘。

首次利用亲和力驱动的转换嵌入模型的热扩散潜力,对DNN模型中的全连接层数据进行非线性映射。

与传统方法相比,DNN模型具有最高的识别准确率,提出了一种基于DNN输出的训练集更新方法,最终模型的识别准确率为85.54%

本工作提出的训练集更新方法,不仅能够快速获取样本标签,还能提高深度学习模型的准确性。

结果表明,将LIBS与DNN模型相结合,可以在高准确率下实现矿石分类。

激光诱导击穿光谱中的应用

激光诱导击穿光谱是一种,基于激光与物质相互作用的新兴原子发射光谱技术,高能脉冲激光瞬间剥蚀材料,产生等离子体,其光谱包含了样本的化学成分信息。

LIBS被称为分析化学中的“未来巨星”,其优点包括简单的样品制备、易于操作、微损伤、快速和原位应用,具有这些优点,LIBS被用作中美两国火星土壤的检测装置

LIBS还应用于许多领域,如煤田中元素的定量分析、生物医学领域中的肿瘤识别,以及地质领域中不同类型矿石的鉴定和微量元素的定量分析。

将机器学习方法应用于LIBS光谱处理,可以大大提高LIBS技术的分析和检测能力,一般来说,在使用传统机器学习方法,对LIBS光谱或元素定量进行分类之前,需要进行特征工程

这主要包括两种方法:特征映射和特征选择,特征映射使用线性非线性方法,将高维特征向量空间映射到低维特征向量空间,特征选择旨在通过选择原始特征的子集来实现降维

作为一种更复杂的机器学习算法,深度学习已被广泛应用于各个领域,并取得了优异的结果。

与传统的机器学习模型相比,深度学习模型无需进行特征工程,因此更有利于自动化LIBS特征工程和分类识别,深度学习已经在LIBS光谱识别中得到了应用。

使用了亲和热扩散模型,来可视化DNN模型中各层的输出数据,以直观地解释DNN模型的特征提取过程,为了进一步提高DNN模型的识别准确率

根据DNN模型的输出提出了训练集更新方法,使用更新后的训练集数据,以更高的准确率训练新模型,混淆矩阵和准确率用于模型评估

最终模型在识别准确率方面取得了良好的成绩,显示出LIBS与DNN模型相结合可以在高准确率下进行矿石分类

第一个神经元的平均权重μ为-0.001,标准差σ为0.0307,Ca II 393.37纳米的权重为-0.0077。

这表明第一个神经元对其没有响应,而在794.80纳米处的光谱线的元素权重为0.205,表明第一个神经元对其做出响应,权重越大,光谱线对最终分类结果的影响就越大。

DNN模型的输出系数,被用来判断样本的输出标签,输出系数接近1,表示模型对此预测具有更大的“信心”,输出结果的准确性和正确判断的数量随着阈值的变化而变化。

随着阈值的增加,输出结果的准确性更高,但可以输出的结果数量更少,例如,当阈值为0.99时,识别准确率为91.90%,准确预测的样本数量为9924,这意味着近一半的测试样本没有输出结果。

激光诱导击穿光谱数据

测试集的识别准确度远低于验证集,这表明训练模型存在过拟合的问题。过拟合的原因是测试集样本和训练集样本来自不同的样本,导致测试集数据和训练集数据分布不一致

分类变得非常困难,在DNN模型的输出结果中,当输出阈值大于0.99时,测试数据的准确性较高,测试集的数据可以用来更新模型,从而提高识别的准确性。

从十二种样本的平均光谱中提取峰值,以元素峰值作为初始特征数据,根据7比3的比例随机将提取的特征样本分为训练集和验证集。

根据优化的模型参数进行模型训练,将测试数据输入模型,计算第八层的输出系数,并将输出系数与设置的阈值进行比较。

大于阈值时将其添加到训练集,使用设置的阈值选择测试集样本来更新训练集,并将更新后的训练集应用于训练新模型。

最终模型的训练集和验证集的准确性和损失,识别准确度随着,训练集更新次数的增加而变化,模型测试结果的混淆矩阵。

类别1到11的识别准确率分别为45.33%、99.90%、98.53%、99.75%、96.09%、99.94%、95.54%、99.55%、98.79%、99.42%和67.39%。

DNN模型的测试集准确率从75.92%提高到85.54%。

当使用多个模型投票时,部分模型本身的准确度不足以导致最终投票结果不准确,这会导致对涉及到更新的样本的识别精度较低,可能会导致最终模型的精度不高

使用训练集更新方法,DNN模型的敏感性和特异性在中得到了详细列示。

这种方法的应用使得DNN模型的平均敏感性从74.95%提高到了87.29%,特异性则从97.60%增加到了98.54%,这个显著的提升证明了训练集更新方法的有效性。

训练集更新方法之所以能够实现更高的识别准确度,主要是因为DNN模型本身相对于传统模型实现了更高的初始准确率

该方法还引入了一个关键的阈值概念,只有当DNN模型的输出概率超过0.99时,才会将测试集样本添加到模型更新的过程中。

这个策略确保了只有高置信度的样本才会被用于训练新模型,从而提高了整体的模型性能。

这一结果进一步强调了训练集更新方法在深度学习模型中的有效性,特别是在处理具有挑战性的数据集时,通过精心设计的策略,研究人员成功地提高了DNN模型的敏感性和特异性,为模型在真实世界应用中的可靠性提供了坚实的基础。

这种方法不仅提高了模型的性能,还减少了误判的可能性,从而增强了模型在实际应用中的可信度

提高材料分析准确性

LIBS技术是一种先进的原子发射光谱技术,它基于高能激光与物质相互作用,产生等离子体并记录其发射的光谱。

LIBS技术在分析化学领域被誉为未来的巨星,因为它具有众多优势,包括简化的样品制备、易于操作、微小样品损伤、快速测量和原位应用等。

这项研究的目标是将深度学习方法应用于处理LIBS数据,以提高LIBS技术在材料分析和检测领域的性能。

传统上,对于利用LIBS光谱进行元素定量或样品分类的任务,需要进行大量的特征工程,包括特征映射和特征选择

深度学习方法的引入改变了这一格局,因为它们能够自动从原始数据中提取特征,无需繁琐的特征工程

在这项研究中,研究人员设计了一个深度神经网络模型,用于处理LIBS数据,为了更好地理解DNN模型的工作原理,研究人员首次使用了亲和热扩散模型,来可视化DNN模型中各层的输出数据,以便更直观地解释模型的特征提取过程。

为了进一步提高DNN模型的性能,研究人员提出了一种称为“训练集更新方法”的策略。

这种方法基于DNN模型的输出结果,只有当模型对样本的分类非常自信时,才将这些样本添加到用于模型更新的训练集中,这个策略的应用显著提高了模型的识别准确度

深度学习方法与LIBS技术相结合,可以实现高性能的材料分析和检测

通过深度学习,研究人员能够充分利用LIBS数据,无需复杂的特征工程,从而更快速、更准确地实现样品分类和元素分析。

这一研究为未来利用LIBS技术进行材料分析和其他应用提供了有力的方法和技术支持。

对LIBS数据进行分类和识别需要进行复杂的特征工程,传统方法存在一定局限性,研究人员设计了一个深度神经网络模型,通过非线性映射数据,成功地实现了对矿石的高准确度分类。

首先介绍LIBS技术的原理和应用领域,强调将机器学习方法应用于LIBS光谱处理的重要性,深度学习模型无需进行繁琐的特征工程,因此更适合自动化LIBS数据分类。

首次采用亲和热扩散模型,用于可视化DNN模型中各层的输出数据,从而直观地解释DNN模型的特征提取过程

这个步骤有助于更好地理解DNN模型是如何学习和提取LIBS数据的特征的。

为了进一步提高DNN模型的准确性,文章提出了一种基于DNN输出的训练集更新方法。

这个方法使用DNN模型的输出结果来更新训练集数据,从而提高了新模型的训练准确度,研究人员详细描述了这个方法的实施步骤,并展示了其在提高模型识别准确率方面的有效性

文章还提供了详细的实验结果和分析,包括模型的准确性、损失、混淆矩阵以及敏感性和特异性等指标。

这些结果表明,结合LIBS和DNN模型可以实现高准确度的矿石分类,最终模型的识别准确率达到了85.54%

总结

这项研究将深度学习方法成功应用于LIBS数据处理,克服了传统方法中的特征工程难题,提高了矿石分类的准确性。

这一方法还引入了训练集更新策略,进一步增强了模型的性能,这项研究为LIBS技术在矿石分类和其他应用中的发展提供了有力支持,展示了深度学习在光谱数据处理中的潜力。

标签: #在数据挖掘的分类算法中比较典型的算法是