龙空技术网

利用逻辑回归和朴素贝叶斯方法预测特定区域的空气污染水平

鸿鹄边缘计算 96

前言:

现在各位老铁们对“逻辑回归算法预测原理”大概比较注意,同学们都想要知道一些“逻辑回归算法预测原理”的相关内容。那么小编在网摘上网罗了一些对于“逻辑回归算法预测原理””的相关文章,希望你们能喜欢,你们一起来了解一下吧!

摘要:利用创新的逻辑贝叶斯回归算法和朴素贝叶斯算法来预测特定区域的空气污染水平。逻辑回归算法和朴素贝叶斯算法是两组算法。该算法在32516条记录的数据集上进行了实现和评估。通过对每种方法进行N=5迭代的编程实验,确定了各种空气污染。阈值为0.05%,置信区间为95%。所使用的 g功率测试约为80%。创新的Logistic回归算法(98.26%)比朴素Bayes算法(97.32%)具有更好的准确率。与朴素贝叶斯算法相比,逻辑回归具有最高的精度。基于2尾分析,精度的显著性值为0.056(p>0.05)、精度0.02(p<0.05)和召回率0.01p<0.05)。逻辑回归在空气污染预测方面优于朴素贝叶斯算法。

1.介绍

空气是这个星球上人类生存和生存的基本元素。所有的生物,包括植物和动物,都依靠空气来基本生存。因此,所有的生物都需要没有危险气体的空气来过上健康的生活。由于这些气体,人类会患有哮喘、支气管炎和其他呼吸系统和肺部疾病。造成这种污染的一个原因是汽车和工业正在以惊人的速度污染[1]。这些污染气体正在对生物的健康造成影响。由于这些原因,我们需要了解[2]地区可能造成健康危害的各种污染材料和气体。有必要预测空气污染水平,并采取预防性的[1]措施。在[3]中,预测帮助我们采取准确的准备水平,以减少其对我们的影响。

本研究的应用有助于理解质量预测模型的原因,这有助于印度气象部门预测空气质量的未来以及它的状态,以便可以采取行动。在过去的5年里,关于这个主题发表的文章总数为25篇。在[4]中,作者发现,无论使用什么算法,1小时的数据集比5分钟的数据集有更好的结果。在[5]中给出的研究中,获得的准确率为70%。这些结果表明,通过实践培训和对班级不平衡的数据管理,可以提高准确性。在论文[4][6]中,准确率达到了80%。基于这些数据,我们采用了各种机器算法来预测排放速率,并进行了比较研究。

在[7]中,准确率达到了75.5%。本文提出了一种用于空气污染预测的深度机器学习算法。上述分析[4]是模型获得80%准确率的最佳研究。由于该方法的准确率较低,因此采用机器学习域,使用逻辑回归算法以较高的准确率来预测和替代较低的准确率。传统算法的局限性是,它在健康风险评估中提供的准确性较低。

这项工作的主要目的是提高预测空气污染水平的准确性。通过与朴素贝叶斯算法的比较,利用创新的Logistic回归算法提高分类性能分析,提高预测空气污染水平的精度分析。

2.材料和方法

该工作正在萨维塔工程学院、计算机科学与工程系、DBMS实验室进行研究。使用克林卡尔克。com,样本量计算为每组5个,G幂为80%,阈值为0.05%,置信区间为95%[8]。根据以往关于尺寸计算的文献,已经计算出了平均值和标准差。在这项工作中使用的组数是两个。在第一组中,使用朴素贝叶斯作为现有算法,创新逻辑回归是第二组算法。

2.1.朴素贝叶斯算法

朴素贝叶斯方法是一种学习过的分类技术,其操作的理念是,每一对被分类的特征都独立于其他特征。

朴素贝叶斯伪码

输入:确定各种培训和测试数据

输出:确定计算精度

1.X_new=rfe。转换(X)。

2.X_train、X_test、y_train、y_test = train_test_split(X_new,y,test_size = 0.25)

3.不适合(X_train,y_train)

4.y_pred=nb。预测(X_test)

5.mse=均方误差(y_test,y_pred)

6.梅=均值绝对误差(y_test,y_pred)

7.r2 =r2_score ( y_test , y_pred )

8.返回精度

图2.表示朴素贝叶斯算法的流程图。其中的第一步是初始化数据集并对其进行预处理。经过特征选择后,应用朴素贝叶斯算法。该算法通过测试和对数据集的训练来衡量其性能。

2.2.逻辑回归算法

创新逻辑回归是一种学习分类方法,用于预测被管理的目标变量的概率。目标变量或因变量的概念是二分法的,这意味着只存在两种分类。Logistic回归算法将在下面的伪代码中得到解决。

逻辑回归的伪代码

输入:确定各种培训和测试数据

输出:确定计算精度

1.X_new=rfe。转换(X)

2.X_train、X_test、y_train、y_test = train_test_split(X_new,y,test_size = 0.25)

3.lr.fit(X_train,y_train)

4.y_pred=lr.预测(X_test)

5.mse=均方误差(y_test,y_pred)

6.梅=均值绝对误差(y_test,y_pred)

7.r2 =r2_score ( y_test , y_pred )

8.返回精度

图1.表示Logistic回归算法的流程图。它解释了第一步是初始化数据集并对其进行预处理。经过特征选择后,该算法通过对数据集进行训练和测试来衡量其性能。硬件配置用作Intel i5处理器,1 TB硬盘和8GB内存。Windows 10操作系统和执行在CoLab和微软Office是软件配置。

首先,根据分类器导入数据集,并调查信息以排序出它们类似的东西。然后,通过将数据分割为属性和标签来对数据进行预处理。在数据分割后,训练已经用算法应用于信息。该算法预测了预期的结果。最后,对研究结果进行了评价。

数据集中的属性是国家、州、城市、地点、上次更新、平均值、最大值、最小值和污染物。

表1是从5个不同的样本数据集中收集的数据。在表1中,与两种分类器比较了精度和测试大小。本文中使用的数据集有250行和9列。属性提供的信息包括平均值、最大值、最小值等信息。表1为样本量为5(N=5)的朴素贝叶斯和创新逻辑回归数据收集(N=5。逻辑回归比朴素贝叶斯算法具有更高的精度,并且它具有MAE、MSE、R平方、RMSE、精度、召回率和精度等参数。

统计分析:在IBM SPSS版本21中用于实现的统计软件。数据的自变量是协议类型、服务和标志,作为数据中的因变量,是本任务中考虑的准确性。本工作采用了独立样本t检验。

3.结果

使用朴素贝叶斯和Logistic回归,样本量为5(N=5)的数据收集如表1所示。逻辑化算法的准确率约为97.32%,而朴素贝叶斯算法的准确率约为98.60%。对于不同的十进制测试大小,精度会有所不同——算法的精度会由于测试大小的意外变化而发生变化。

表2为两组的组统计分析。NB和LR的平均精度分别为92.71和96。分别为17。NB和LR的平均精度分别为88.40和94.60。NB和LR的平均回忆率分别为92和96。

逻辑样本回归算法和朴素贝叶斯算法的独立样本检验分析。基于2尾分析,精度的显著性值为0.056(p>0.05)、精度0.02(p<0.05)和召回率0.01(p<0.05)。与现有算法的性能相比,建议的Logistic回归算法优于朴素贝叶斯算法。

图1。逻辑回归算法的流程图。

在图1.中,显示了Logistic回归算法的流程图。预测精度的架构包括在预测空气污染水平精度的程序中所包括的步骤。它包括初始化的数据收集、预处理、特征选择、应用LR算法和性能措施,如图1所示。

图2。朴素贝叶斯算法的流程图。

在图2.中,显示了朴素贝叶斯算法的流程图。预测精度的架构包括在预测空气污染水平精度的程序中所包括的步骤。它包括初始化的数据收集、预处理、特征选择、应用NB算法和性能指标,如图2所示。

图3。线性回归算法与朴素贝叶斯算法在平均精度方面的比较。

从图3。,简单条形精度均值(LR,NB),表示线性回归算法平均精度的柱状图为98.26,朴素贝叶斯算法为97.32。所提出的线性回归算法的性能优于朴素贝叶斯算法。

4.讨论

创新的Logistic回归算法(98.26%)比朴素贝叶斯算法(97.32%)具有更好的准确率。因此,Logistic回归算法比以前的算法被修改并转换为最佳算法产生最好的精度。

在[9][10]中,利用概率模型来揭示城市社区[11]对不同边界的质量。在[12][13]中,本实验的精度为85。6%.作者使用机器学习算法,如逻辑回归、决策树和随机森林,来预测空气质量记录。从结果,作者推测逻辑回归算法更好地预测空气质量指数。在[14][15]中,本实验获得的准确率为51.21%。本文研究了整合分类器的策略,以及最近公开发布的具体增强计算,以预测不久的未来的空气质量预期。在[16]中,本实验获得的准确率为91.62%。本研究提出了一种预测智能城市空气质量指标的机器学习方法。基于机器学习的预测模型的空气质量记录表征系统在[17]中有效实现。在这项研究中并没有任何相互矛盾的发现。

本研究的关键局限性是,该数据集只有少数的参数,可以用于估计新的分类的准确率百分比。在未来,通过增加自变量和因变量的数量,可以提高模型的准确性。

5.结论

在本研究中,在我们的局限性内,创新逻辑tic回归(98.286%)似乎比朴素贝叶斯(97.32%)更准确。

参考文献

[1] Zhang C,Yan J,李Y,等。早期空气污染预测作为一种服务:一种整体学习方法2017年IEEE网络服务国际会议(ICWS)。打印前的Epub 2017.DOI:10.1109/icws.2017.76.

[2],G,陈J,罗查A。发明性通信和计算技术:ICICCT 2019程序。施普林格自然,2020年。

[3]利特曼-OvadiaH,Raas-罗斯柴尔德E。航空飞行员的性格优势:解释生活和生活工作满意度和预测客户关系管理绩效。心理学2018年;2009年:2083-2102年。

[4] Simu S,Turkar V,等。利用机器学习技术预测空气污染。2020 IEEE孟买分部签名会议(IBSSC)。Epub将提前于2020年出版。文件编号:10.1109/ibssc51096.2020.9332184.

[5] Bae WD,Kim S,Park C-S,等人。机器学习技术的性能改进利用成人哮喘患者的聚类数据,预测呼气峰值流量比的恶化与室内空气质量的短期暴露水平之间的相关性。《公共科学图书馆一号》2021年;16: e0244233。

[6] Kumar A,Goyal P。对德里地区每日空气质量指数的预测。总科学环境2011年;409:5517-5523年。

[7] Xayasouk T,李H。利用深度学习技术的空气污染预测系统。空气污染XXVI。Epub将提前于2018年出版。DOI:10.2495/air180071.

[8] Miah MO,可汗党卫军,沙塔布达S,等人。提高不平衡网络的检测精度使用基于随机森林的聚类欠采样的入侵分类。2019年第一届科学、工程和机器人技术进步国际会议(国际)。Epub将于2019年出版。DOI:10.1109/icasert.2019.8934495.

[9] Mahanta S,罗摩克里什努都T,Jha RR,等。城市空气质量的回归预测分析。TENCON 2019 -2019 IEEE第10区会议(TENCON)。打印前的Epub 2019.DOI:10.1109/tencon.2019.8929517.

[10] Zhang C,Liu B,Yan J,等。作为一种移动服务的空气质量的混合测量:一种图像基于方法。2017年IEEE网络服务国际会议(ICWS)。Epub将提前于2017年出版。DOI: 10.1109/icws.2017.105.

[11]卡巴贾尔-埃尔南德斯JJ,桑切斯-费尔南德斯LP,卡拉斯科-奥乔亚JA,等。评估和利用模糊逻辑和自回归模型预测空气质量。2012年大气环境;60:37-50。

[12]帕苏普雷蒂VR,Uhasri,Kalyan P,等。利用机器学习技术对数据日志的空气质量进行预测。2020年第6届高级计算和通信系统国际会议(ICACCS)。Epub将提前于2020年出版。DOI:10.1109/icaccs48705.2020.9074431.

[13]和记黄埔KD,史密斯S,法鲁基SJ。将MODIS气溶胶光学厚度数据与横跨德克萨斯州的地面PM2.5观测,用于实时空气质量预测系统。大气环境,2005年;39:7190-7203。

[14]郑H,程勇,李H。细粒度空气质量预测的模型集成的研究。中国通信公司2020年;17日:207-223年。

[15]杨R,严F,赵N。基于贝叶斯网络的城市空气质量分析。2017年IEEE9日国际通信软件和网络会议(ICCSN)。Epub将提前于2017年出版。DOI:10.1109/iccsn.2017.8230261.

[16]马哈林根U,伊兰戈万K,Dobhal H,等。一种研究空气质量的机器学习模型智能城市预测。2019年无线通信信号处理和网络国际会议(WiSPNET)。Epub将于2019年出版。DOI:10.1109/wispnet45539.2019.9032734.

[17] Amado TM,Dela Cruz JC。基于机器学习的空气预测模型的开发质量监测和特性鉴定。TENCON 2018 -2018年IEEE地区第10届会议。Epub将提前于2018年出版。DOI:10.1109/tencon.2018.8650518.

标签: #逻辑回归算法预测原理