龙空技术网

机器学习识别电化学阻抗的等效电路图

电化学能源 1208

前言:

现在咱们对“svm算法实现多维数据图”都比较关心,朋友们都需要学习一些“svm算法实现多维数据图”的相关内容。那么小编在网上收集了一些对于“svm算法实现多维数据图””的相关知识,希望看官们能喜欢,各位老铁们快快来学习一下吧!

【背景】

电化学阻抗光谱法(EIS)是通过测量阻抗随正弦波频率的变化来研究电化学过程的。为了解释EIS数据,最广泛使用的方法是构建等效电路模型。在这种方法中,电化学系统被视为一个等效电路,它是由串联或并联的基本元件组成的,如电阻(R)、电容(C)和恒相元件(CPE)。这些等效电路的结构和每个元件的值都可以测量,通过这些元件的电化学含义可以分析电化学系统的细节。如何选择合适的等效电路模型是关键的一步,因为后果讨论是基于有一个准确的模型的假设。目前,常见的方法是根据不同的应用筛选出几个潜在的模型,然后用数学拟合的方法模拟出相应的模式。当有几个可信赖的模型时,应该对它们进行分类,找到最合理的模型,这些过程中涉及到主观因素和判断。

为了避免人的主观性,可以引入机器学习技术。机器学习是一类用于分析多变量非线性系统的算法的总称。将机器学习方法作为数据分析,并基于连接数据集的不同属性的敏感关联性,导致赋予有用的信息来定义具体应用中的属性。在各种机器学习工具中,本工作选择支持向量机(SVM)来处理这个任务。EIS模式识别是一个典型的分类问题,而SVM在解决小样本、非线性和高维模式识别方面表现出独特的优势。在SVM方法中,数据点被看作是多维向量,这些点可以被超平面分开。可能有许多超平面可以对数据进行分类。SVM可以找到最佳的超平面,使其与各边上最近的数据点的距离最大化。SVM已被应用于模式识别问题,如人像识别和文本分类。

【工作介绍】

本文从已发表的文章中收集了数百个EIS数据及其等效电路模型,这些数据主要集中在电化学储能应用(即电池和超级电容器)。基于这个数据库,优化了SVM的各种参数,在识别EIS的等效电路模型方面达到了可接受的精度。

【方法】

2.1.建立数据库

为了建立一个EIS数据库,从已发表的论文中提取了500多套EIS数据及其等效电路。从现有文献中提取数据有两个主要原因。首先,大量的前人研究保证了足够的数据量。考虑到每个研究者使用的测试工具、测试规范和所选参数都很不同,它可以为我们的数据分析提供足够的普遍性。另一方面,在已发表的论文中,EIS的等效电路模型一定是由研究者精心选择的,这意味着作者帮助我们进行了有效的模型筛选,并尽可能地提高了模型的准确性。

2.2.机器学习过程

SVM是由Python和Scikit-learn软件包建立的。SVM的基本模型是在特征空间中定义最大区间的线性分类器。SVM的数学原理如下。

给定一个数据集T,T={(x1,y1),(x2,y2),...,(xN,yN)}。

在T的特征空间中,有一个超平面ω x+b=0,超平面对样本点的几何区间为γi:γi=yi(ω/ω xi+b/ω)

遍历所有样本点,找到几何区间的最小值,其定义为支持向量到超平面的距离:γ=min(i=1,2,...,N)γi

SVM算法的目的是为了解决问题,以实现最大的分割超平面,即max(ω,b)γ

对于特征空间为非线性的问题,需要使用核函数将特征向量映射到高维空间,使原来线性不可分的数据在映射的空间中变成线性可分。本研究中使用的核函数是径向基函数核函数('RBF')和线性核函数('Linear')。

3.结果和讨论

整个过程显示在 图1.原始的EIS是从文献中提取并离散成可读的数据点。所有这些EIS都来自电化学储能设备,特别是锂离子电池和超级电容器。此外,为了使来自不同状态的EIS具有可比性,数据被归一化并转换为CSV文件。

图1.通过机器学习进行EIS模式识别的过程图。

根据EIS等效电路的本质,总结出五种等效电路模型(图2).所有这些模型都由三个部分组成,即电阻、CPE和沃伯格元件(W)。在实际测试中,EIS实验中的电容器往往没有理想的表现。相反,他们的行为像一个恒定的相位元素(CPE)。沃伯格元素用于描述电荷扩散通过阻挡层时的电极行为。归一化的EIS被用作输入数据,相应的等效电路类型被用作输出数据。

图2.五个不同的等效电路模型。

在获得五种典型模式的基础上,列出了每种类型下的几个数据的代表(图3).从这些数据可以看出,在同一类别下,数据的谱系差异很大;或者数据的形状相似,却属于不同的模式。正是因为数据分类的这种模糊性,传统的分析方法遇到了瓶颈。

图3.不同图案的等效电路的例子。

在进行机器学习过程之前,EIS数据集被随机分为训练集和测试集。测试集的数据占总数据的20%。基于这两个数据集,进行了核函数为 "RBF "的SVM。SVM中最重要的参数之一是惩罚系数'C',也就是对错误的容忍度。C越大,误差越难以容忍,意味着SVM更容易过拟合。C越小,就越容易欠拟合。通过测试不同的C值,发现C等于1时,整体性能最好。同时,gamma是 "RBF "核函数的一个参数,它影响训练和预测的速度。随着gamma的增加,训练集的准确度增加,但测试集的准确度下降,说明存在过度拟合的趋势(图4a).

图 4. (a) 网格搜索惩罚系数'C'和gamma的优化值。(b) 各种机器学习策略之间的性能比较。(c) 测试SVM的一个例子。原始数据(红点)来自公共数据库中的18650商用电池。嵌入的饼状图是由优化的SVM做出的ESI等效电路模型的可能性分析。(d) (c)中EIS的等效电路和各元素的拟合值(单位:Ω)。

为了弄清C和gamma的优化值,我们进行了SVM的网格搜索技术。网格搜索的目的是对一组参数进行交叉验证,找到最佳分数。对于惩罚系数'C'和gamma值,我们为每组选择12个数据点来形成交叉验证测试。这144组参数组合被带入SVM算法,在测试数据集上相应的计算分数被列在图4a中。这些分数表示SVM在这个数据集中正确预测了多少个样本。结果显示,C=5和gamma=0.35的组合可以在SVM的测试数据集上取得最高分(0.48)。

通过与其他算法的比较, SVM体现出优越性(图4b)。由于这些算法在相同的数据集上运行,分数可以反映它们的预测准确率,并找出适合本系统的算法。在九种算法中,决策树、随机森林和SVM-RBF在训练集上取得了良好的效果(得分>0.8),这表明这些模型在数据集上被准确地拟合。此外,需要指出的是,各算法在测试集上的得分并不高,说明在测试集上的准确率仍需提高。与决策树和随机森林算法相比,参数优化的SVM在测试集上的得分最高(0.48),也就是说,SVM算法在测试过程中可以达到最高的准确度。实验的误差主要是由于数据数量较少造成的。

基于优化的SVM,展示了使用机器学习策略来分析真实的EIS谱的过程。选择了一个商用18650电池的典型EIS数据作为目标样本。图4c中的原始数据来自18650的开源数据库,经过归一化处理后输入我们的SVM模型进行仿真。然后,该算法可以给出EIS属于哪个模型的概率分布。结果,SVM给出的Type-1的概率为49%,是所有候选模式中最高的(图4c的饼图)。因此,我们选择Type-1模型作为等效电路模型来适应数据。如图4c所示,拟合结果与原始EIS频谱有良好的一致性。最后,进一步计算各等效电路元件的值,完成EIS分析过程(图4 d)。

【总结】

这项工作应用机器学习来识别EIS的等效电路模型。从发表的论文中提取了大量的EIS,并总结了五种典型的等效电路模型。比较了各种算法对既定数据中EIS的分类能力。结果表明,在训练集和测试集中,SVM的综合性能最好。在实际测试中,SVM可以分析出给定EIS频谱的模式概率,并帮助我们有效地分析其等效电路模型。此外,这项工作证明了机器学习工具在电化学研究中的应用潜力。

han Zhu, Xinyang Sun, Xiaoyang Gao, Jianrong Wang, Naiqin Zhao, Junwei Sha,

Equivalent circuit model recognition of electrochemical impedance spectroscopy via machine learning,

Journal of Electroanalytical Chemistry,

.

标签: #svm算法实现多维数据图