前言:
如今姐妹们对“连续投影算法c”可能比较关注,小伙伴们都需要分析一些“连续投影算法c”的相关知识。那么小编也在网上搜集了一些有关“连续投影算法c””的相关内容,希望大家能喜欢,同学们一起来了解一下吧!0引 言
番茄是我国需求量较高的蔬菜之一,在全国范围内大面积栽培种植。 番茄作为茄科作物之一,本身所含的谷胱甘肽、维生素、番茄红素、β-胡萝卜素等营养成分对于人们来说就具有很高的应用价值。因此,番茄的高质量生产是必不可少的。番茄的生长状况可以通过叶片的叶绿素含量表现出来,叶绿素含量是番茄重要的生理指标之一。可通过对叶绿素含量的检测从而对微咸水灌溉下番茄生长发育情况、健康状况做出监测。目前,常见的测定方法往往操作流程繁琐、费时,只能进行单个叶片检测,同时传统方法一般具有事后性和破坏性,不能满足高效技术要求。因此,无损、高效的检测方法是番茄高质量生产中重要的环节。
高光谱成像技术是近年来无损检测技术发展的新趋势,将光谱信息和数字成像信息相集成,主要是利用光谱反射率以及光谱反射波形特征,从而可以精确地检测到所需样本图像中每一个像素点的光谱数据以及图像信息,这种技术具有速度快,效果好等优点,同时在检测过程中不会破坏样本,在很大程度上弥补了传统检测方法中存在的不足,能够为可视化与高效无损检测提供一定的技术依据。高光谱技术被广泛应用于多个领域。 包括农产品质量评估、品种鉴别、食品的安全检测、肉类保鲜等。
1结果与分析
1.1 样本划分方法的选择及模型的建立
为了建立稳健的模型,需对样本集进行划分。本研究采用RS、KS、SPXY方法进行校正集与预测集样本划分,结果如表1、表2 所示。
表1 不同样本划分方法对叶绿素的PLSR模型结果统计
从表1 可以得出, SPXY法的预测集相关系数Rp大于0.8,高于KS 法和RS法。 数值之和也可用来评价模型效果,其值越大说明精确度越高。KS法之和为1.6631,RS法为1.4838,SPXY法为1.7021,SPXY法的Rc与Rp之和数值也是3种方法数值最高的。 并且采用SPXY法建立的模型中,预测集的RMSEP值均小。 综上考虑,选择SPXY法划分番茄叶片叶绿素样本集最为合适。
表 2 样本番茄叶片叶绿素统计
表2可以看出,使用SPXY法对样本中叶绿素值进行划分是可行的。 对于192个番茄叶片叶绿素值样本,取2/3样本作为校正集,1/3样本作为预测集,并且预测集的各指标值包含在校正集的指标值范围之内。 校正集和预测集的方差值也较为理想,由此可以说明所选样本数据集的划分具有代表性。
1.2 原始光谱特征波长下不同光谱参数的建模分析
为了研究全波段(900~1700nm)下Kubelka-Munk处理对建模的影响,利用UnscramblerX10.4软件对原始光谱的反射率进行转换以及 Kubelka-Munk 函数转换,研究不同光谱参数对番茄叶片叶绿素含量的预测。 基于PLSR分别对R、K、-M光谱曲线建立模型对比分析,结果见表3。
表 3 原始光谱特征波长下不同光谱参数的PLSR 模型
从表3可以看出,Kubelka-Munk处理后建模的Rp值小于原始光谱建模的Rp,说明处理后的光谱数据建模的预测效果并不是太理想。 原始光谱的Rc值大于Kubelka-Munk处理的Rc值。 但二者之间的差异较小,说明2个模型的性能差异不大,而Kubelka-Munk处理只是模型性能做了细微的调改。 因此,可以采用原始光谱进行数据处理,不仅减少了数据的前期处理,而且能够获得较优的校正模型与预测模型。
1.3 预处理方法的选择
前期为了获得真实清晰的图像进行黑白校正,这只是简单的对光源强度分布不均以及在图像采集过程中自身暗电流等不利因素进行了消除。 而样品的背景色和杂散光等都还会对试验结果产生一定的误差,为了提高模型的精确性,需要对光谱进行一定的处理。 而在对比分析中,要充分考虑各个变量之间的影响,而偏小二乘法能够综合考虑变量之间的关系,能够在多重共线性条件下进行回归建模,因此可以利用PLSR模型进行光谱预处理的结果比较,结果见表 4。
表 4 不同预处理方法对叶绿素含量的 PLSR 模型结果统计
从表 4 可以看出,对于番茄叶片的中叶绿素指标来说,经过MSC法对样本值进行预处理后建立的PLSR模型与原始数据相比,具有较好的模型参数,Rc和Rp值较之前有所提高,RMSEC 和RMSEP 都有所减小。 综上所述,MSC为番茄叶片叶绿素样本的最佳预处理方法。
1.4 特征波长的选取
1.4.1 PLSR权重系数法提取特征波长
β 系数是反映评价指标重要程度的量化系数,系数越大,说明该指标对总目标影响越大。 由图2 可知,基于对叶绿素进行MSC预处理后建立的PLSR模型进行特征提取,第4成分具有最显著的特征,选为最优主成分数用于提取特征波长;在 900-1700nm 波段下,叶绿素的吸收很弱,光谱吸收特征不明显。 所以在 β 系数图中按照局部绝对值最大原则选取7个叶绿素特征波长为1008、1202、1226、1369、1515、1628、1657nm。 有效地降低了光谱的维数,方便后期建立模型。
1.4.2 竞争自适应重加权算法提取特征波长
竞争性自适应重加权算法即采用自适应重加权采样(ARS)技术在模型中选择并保留下回归系数绝对值大的波段数,同时,去掉权重小的波段数,此算法在计算取值的过程中是采用交互验证法选出均方根误差值最低的子集,此算法所取值覆盖范围广,因此可有效地寻出最优与最具代表性的变量组合。利用CARS方法提取900~1700nm 范围内的特征波长,得到结果见图 3。 由图 3 可知,在采样运算过程中,变量数的下降过程呈现由快变慢的趋势,图3-B 是基于自适应加权采样选择特征波长建立偏最小二乘模型预测效果的显示。 图 3-C 回归系数路径则反映了特征波长变量回归系数的变化趋势,∗号线反映了RMSECV最小位置,∗号线之后部分有效信息被去除,RMSECV值持续增大。 叶绿素依据RMSECV最小值原则选择11个特征波长,模型拟合效果最佳,数据压缩率为95.7% ,有效去除了环境干扰及不相干信息,但可能有效信息也被去除。
1.4.3 无信息变量消除变换法(UVE)提取特征波长
如图 4 所示,在 900-1700nm 波段范围内,在主成分数是10时t-value值模型拟合效果最佳。图中左侧表示256个输入变量的分布曲线,而右侧图表示随机变量的分布曲线。 最终,对于叶绿素选取了96个特征波长。
1.4.4 连续投影算法(SPA)提取特征波长
选择m-min =10,m-max=30,图5-A 表示特征变量数与RMSE的变化曲线,可以得出RMSE最小值与特征变量数的关系,综合分析可以确定叶绿素特征波长数为14 个,RMSE值为4.1343。 图5-B为SPA算法所选取叶绿素的14个波段数。
1.4.5 UVE+SPA 组合算法提取特征波长
通过UVE法提取900-1700nm 波段范围内的特征波长为96个,但与其他方法相比发现数据量仍然较大,为了降低维数,减少冗余,可以对数据进行进一步的提取与优化。 在本试验中将UVE 法和SPA 法相结合来提取特征波长(图6)。
由图 6 可知,在900-1700nm 波段对提取出的特征波长进一步采用SPA法,组合法UVE+SPA与UVE法相比,数据由96个减少到13个并且叶绿素的RMSEC值为3.8635,与UVE法相比,大大压缩了数据,方便后续的建模与分析。
1.4.6 不同方法提取特征波长及对比分析
为了优选最佳的特征波段进行模型建立,对 5种特征波长提取的波段进行分析,结果见表 5。
表 5 特征波长选取统计
由 表 5 可 知,5种 特 征 波 长 提 取 方 法 中, βcofficientoPLSR提取了7个特征波长,占总波长的2.7% ;CARS 提取11个,占总波长的4.3% ;UVE提取96个,占总波长37.5% ;SPA提取 14个,占总波长的5.5% ;UVE+SPA提取13个, 占总波长的5.1% 。 由于UVE法选取的波长数较多, 所以和SPA组合使用,可以减低冗余,减少维数。 采用这 5种方法选取特征波长,各个波段均有挑选,具有一定的合理性。
1.5 建模方法的比较分析
为了对比不同建模方法对提取特征波长的建模效果,采用多元线性回归、主成分回归、偏最小二乘回归方法进行模型对比分析,结果见表6。由表6可知,(1)与偏最小二乘回归模型对比,UVE挑选出来的特征波长建立的模型Rc和RCV最大, RMSEC和 RMSECV最小,校正模型优于其他模型。 在预测能力上,采用UVE法提取的特征波长建立的模型有最大的Rp值 0.8495和最低的RMSEP。
表 6不同特征提取方法建模效果对比
值4.3375,说明该模型预测能力的稳定性优于其他模型。 综合各个参数,采用 5 种方法提取的特征波长建立的PLSR模型中UVE挑选出来的波长所建立的是最优模型。(2)多元线性回归模型对比,在 5种提取特征波长的方法中UVE法的Rc值最大RMSEC值最小,但RCV值较小,说明预测能力的稳定性不强。 而SPA法的Rc值次于UVE,但RCV值较高。 从综合参数角度来看,SPA法建模效果是5中方法中最佳的,所以,选择SPA建立MLR模型。(3)主成分回归模型对比,CARS提取特征波长的方法,均具有最高的Rc、RCV和Rp值,最低的RMSE、RMSECV、RMSEP值。 因此,无论是校正能力还是预测能力,CARS效果都是5种方法中最佳的。
1.6 最优特征波长模型比较
通过光谱的预处理,提取特征波长等方法,可以得出最优的特征波长的建模方法(表 7)。
表 7最优特征波长模型对比
由表 7可知,使用UVE法建立的PLSR 模型与其他2个相比,模型性能参数较好,拥有较高的Rc值0.8624和较低的RMSEC值4.4489,预测模型的Rp在3种模型中也有较好效果,具有一定的校正能力和预测能力,并且与全波段建立的PLSR模型的Rc值较为接近,差异小。 综合参数来看,UVE-PLSR模型代表全波段建模是具有可行性的,UVE-PLSR模型结果见图7。
2结 论本试验提出了基于近红外高光谱成像技术对叶绿素含量的快速检测。 将成像技术与化学计量学方法相结合,建立了番茄叶片叶绿素含量的PLSR模型。 对叶绿素采用SPXY法进行样本划分。并基于原始光谱与Kubelka-Munk处理光谱参数建立模型比较,对比分析可知经Kubelka-Munk处理后的模型参数低于原始光谱参数。 因此,试验采用原始光谱进行后期的数据分析。 最终建立并分析了基于特征波长的PLSR、MLR、PCR模型,并对模型的性能进行了评价。 其中UVE-PLSR最优,其预测模型的Rp值为0.8495,RMSEP为4.3375。 本试验利用NIR高光谱成像技术对番茄叶片叶绿素进行无损检测是可行的。 能为今后高光谱成像技术应用于番茄品质的在线检测提供参考,也可为推动宁夏回族自治区地方番茄产业快速发展提供技术支持。
欢迎关注公众号:莱森光学,了解更多光谱知识。
莱森光学(深圳)有限公司是一家提供光机电一体化集成解决方案的高科技公司,我们专注于光谱传感和光电应用系统的研发、生产和销售。