光学仪器  2020, Vol. 42 Issue (6): 1-8   PDF    
高光谱成像技术实现马铃薯叶片叶绿素无损检测
卓伟, 于旭峰, 李欣庭, 龚冬冬, 冯洁     
云南师范大学 物理与电子信息学院,云南 昆明 650500
摘要: 针对马铃薯叶片,依托高光谱成像技术实现叶片叶绿素含量的无损检测。利用相关性分析获得马铃薯叶片叶绿素敏感波段,结合植被指数,建立基于光谱导数、植被指数的叶绿素含量传统预测模型与贝叶斯正则化−反向传播(BR-BP)神经网络模型。以489 nm光谱一阶导数值、修正型叶绿素吸收植被指数(MCARI)、陆地叶绿素指数(MTCI)为自变量建立BR-BP神经网络模型,其校正集决定系数、预测集决定系数、均方根误差分别为0.8464,0.6804,0.0746。研究表明,传统模型中光谱一阶导数−幂函数模型可较为准确地预测叶绿素含量,BR-BP神经网络模型相比传统预测模型具有更高的预测精度,因此可以实现马铃薯叶片叶绿素无损检测。
关键词: 光谱导数    植被指数    叶绿素    反向传播神经网络    
Non-destructive detection of potato leaf chlorophyll with hyperspectral imaging technology
ZHUO Wei, YU Xufeng, LI Xinting, GONG Dongdong, FENG Jie     
School of Physics and Electronic Information, Yunnan Normal University, Kunming 650500, China
Abstract: Based on the hyperspectral imaging technology, the non-destructive detection of the chlorophyll content of potato leaves is realized. Using correlation analysis to obtain the chlorophyll sensitive band, and combining with the vegetation index, the traditional prediction model of chlorophyll content and the Bayesian regularization-back propagating (BR-BP) neural network model based on spectral derivative and vegetation index were established. The BR-BP neural network model was established with the first derivative value of the 489 nm spectrum, MCARI, and MTCI as independent variables. The coefficients of determination for the calibration and validation sets, and the root mean square error were0.8464, 0.6804, and 0.0746, respectively. The results showedthat the spectral first-order derivative-power function in the traditional model could accurately predict the chlorophyll content. Compared with the traditional prediction model, the BR-BP neural network model had higher prediction accuracy. Thus, it could realize the non-destructive detection of potato leaf chlorophyll.
Key words: spectral derivative    vegetation index    chlorophyll    BP neural network    
引 言

叶绿素是植物进行光合作用的主要色素,它位于植物细胞的类囊体薄膜上,在光合作用的光吸收过程中起核心作用。因此,叶绿素含量及其变化情况能够很好地反映植物的光合作用能力、生长健康状况等[1-2],在监测农作物长势、病虫害、农作物产量、预测农作物成熟期等方面有着重要意义[3]。目前,测量叶绿素含量的方法主要是分光光度法。虽然该方法能准确测定叶绿素含量,但耗费人力,测定时间长,且对植物叶片有破坏性。

随着高光谱技术的发展,国内外学者开始探讨研究植物叶片叶绿素与其高光谱信息之间的关系并取得较好的成果,已验证了利用高光谱技术无损测定叶片叶绿素的可能性。Madeira等[4]确定了绿豆叶片的光谱反射率和叶绿素含量相对值(SPAD值)之间的相关关系。Filella等[5]研究发现红边位置和红边面积可以指示植物叶绿素含量、生物量和水分状态。牛鲁燕等[6]以葡萄叶片的高光谱反射率和SPAD值为数据源,筛选叶绿素敏感波段,建立了基于高光谱反射率的葡萄叶片叶绿素含量估测模型。邹小波等[7]选取8个具有代表性的植被指数,建立特征波长λ下相应的光谱反射值R与黄瓜叶片叶绿素含量之间的关系模型;确定了最优植被指数所包含的695~705 nm和750~800 nm这2个波段。宋开山等[8]实测了不同水肥耦合作用下大豆冠层的高光谱反射率与叶绿素含量数据,采用特定叶绿素敏感波段建立了植被指数叶绿素估算模型。

综上所述,国内外学者利用高光谱技术反演叶绿素的研究主要集中于大豆、小麦、水稻、玉米等大田作物及葡萄、苹果等木本植物[9-12],对作为世界第四大粮食作物的马铃薯研究较少,且大多数研究的是植物叶绿素含量相对值SPAD,对其真实值快速检测的研究尚少。鉴于此,本文利用实验测得的80组健康马铃薯叶片高光谱数据与叶绿素真实值作为样本,结合光谱导数与植被指数,建立预测马铃薯叶片叶绿素含量的传统模型与反向传播(BP)神经网络模型。研究发现BP神经网络模型预测精度高于传统模型,可用作快速无损检测马铃薯叶片叶绿素含量,为马铃薯的种植、管理和生产提供科学依据。

1 材料与方法 1.1 实验材料

实验所用马铃薯叶片均摘自云南师范大学生命科学学院的马铃薯实验基地,采摘时间为2019年10月8日至27日,总计80个样本叶片;采摘的叶片要求生长状况良好,健康,无病害侵染。为保证实验结果准确性,80个样本叶片随机摘自实验基地不同马铃薯植株。选取总样本数的75%作为实验校正集,即选取60个样本作为校正集,其余20个样本作为预测集。

1.2 光谱反射率测定

叶片光谱反射率的测定采用四川双利合谱公司生产的Gaia-Sorter型高光谱分选仪,其中搭载GaiaField-F-V10E型高光谱相机,响应波长为400~1000 nm,光谱分辨率为2.8 nm。

分选仪开机预热15 min后采集叶片光谱反射率。为消除噪声影响,需对原始光谱反射率进行校正:在相同条件下采集标准白板光谱反射率,得到白帧W;采集无光环境下光谱反射率,得到黑帧D;设叶片原始光谱反射率为R,则校正后反射率R′为

$R' = \frac{{R - D}}{{W - D}}$ (1)

图1为校正后80个样本的光谱反射率曲线,其中出现在520~580 nm处的反射峰与叶片叶绿素有关,750~1000 nm处的反射率差异与叶片组织细胞结构、含水量有关。

图 1 80个样本的光谱反射率 Figure 1 Spectral reflectance of 80 samples
1.3 叶绿素含量测定

实验采用分光光度法对马铃薯叶片叶绿素含量进行测定。用电子天平称得每片叶片质量m(单位:g),将其剪碎置于研钵中,加入少量石英砂和碳酸钙粉末及体积分数为95%的乙醇溶液,研磨至组织变白,再加入适量乙醇溶液,研成匀浆,于室温下暗处静置10 min[13];用一层干滤纸将匀浆过滤至25 mL的容量瓶中,待滤纸和残渣全部变白后用乙醇溶液定容至25 mL,得到叶绿素提取液。最后用分光光度计测得提取液在波长652 nm处的吸光度A652,利用

$c{\rm{ = }}\frac{{{A_{652}} \times 1000}}{{34.5}}$ (2)

得到提取液中叶绿素总质量浓度(单位: mg/L),其中34.5是叶绿素在652 nm波长下的吸光系数。再利用

$\omega {\rm{ = }}\frac{{c \times V}}{{m \times 1000}}$ (3)

得出叶绿素质量分数(单位:mg/g),其中V为提取液体积(本实验中V=25 mL)。所有样本叶片叶绿素含量统计结果如图2所示,校正集与预测集叶绿素含量最小值分别为0.9121 mg/g和0.949 5 mg/g,最大值分别为1.382 7 mg/g和1.4266 mg/g,平均值为1.113 6 mg/g和1.1510 mg/g, 标准偏差(SD)为0.122 0和0.122 9。校正集与预测集数据差别较小,有利于叶绿素预测模型建立。

图 2 样本叶片叶绿素含量统计 Figure 2 Chlorophyll content statistics of sample leaves
2 高光谱特征参数选取 2.1 光谱导数的特征参数选取

光谱导数可以增强光谱曲线在坡度上的细微变化,对植物来说,这种变化与植物的生物化学吸收特性有关[14]。因此,采用光谱导数的方法选取高光谱特征参数,并应用于叶绿素含量的反演是可行的。

对样本光谱反射率进行一阶导数运算,得到图3(a)所示光谱反射率一阶导数曲线。用每个波段的光谱反射率一阶导数值与叶绿素含量进行Pearson相关性分析,得到叶绿素含量与其光谱一阶导数的相关性分析曲线。由图4(a)可知473~552 nm、567~665 nm、683~710 nm波段中光谱反射率一阶导数值与叶绿素含量相关性达到了0.01极显著相关水平;在498 nm处光谱反射率一阶导数与叶绿素含量相关性最大,相关系数为−0.697。同理,对样本光谱反射率进行二阶导数运算与相关性分析,得出在496 nm处光谱反射率二阶导数与叶绿素含量相关性最大,相关系数为−0.657,如图3(b)图4(b)所示。因此分别选择498 nm处光谱反射率一阶导数值与496 nm处光谱反射率二阶导数值作为自变量,用于建立基于光谱导数的马铃薯叶片叶绿素含量预测模型。

图 3 样本叶片光谱导数图 Figure 3 Spectral derivative graph of sample leaf

图 4 光谱导数与叶绿素含量相关性曲线 Figure 4 Correlation curve between spectral derivative and chlorophyll content
2.2 植被指数特征参数选取

植被指数是根据植被的光谱特性,将高光谱可见光与近红外波段进行组合而形成的各种无量纲参数[15],已经成为定性、定量评估植被的常用方法之一;它对植被的生物、物理参数,如叶面积指数(LAI)、叶绿素含量、氮含量等生物量的灵敏度远高于单波段反射率,而且其计算简单有效[16]

选取与叶绿素相关的归一化植被指数(NDVI)、比值植被指数(RVI)、改进型叶绿素吸收植被指数(TCARI)等10种植被指数与马铃薯叶片叶绿素含量进行相关性分析。如表1所示,GNDVI、TCARI、MCARI、MTCI与叶绿素含量均达到极显著相关水平,MTCI与叶绿素含量呈最大正相关,相关系数为0.4315;MCARI与叶绿素含量呈最大负相关,相关系数为−0.4833。实验选择相关性达到极显著相关水平的GNDVI、MCARI、MTCI作为自变量特征参数,建立基于植被指数的叶绿素预测模型。

表 1 植被指数描述及其与叶绿素含量相关系数 Table 1 Description of vegetation index and correlation coefficient with chlorophyll content
3 模型建立与分析 3.1 基于光谱导数的叶绿素含量反演模型

基于光谱导数建立的叶绿素含量反演模型如表2所示,根据校正集决定系数Rc高、预测集决定系数Rv高、均方根误差RMSE小的原则选择最优马铃薯叶片叶绿素含量反演模型。经对比可以看出,基于光谱一阶导数特征参数建立的模型,其建模和预测效果均优于基于光谱二阶导数建立的预测模型。

表 2 基于光谱导数的叶绿素含量反演模型 Table 2 Chlorophyll content inversion model based on spectral derivative

在光谱一阶导数模型中,对数模型的决定系数Rc最大,为0.7036,建模效果优于其他模型;幂函数模型校正集决定系数Rc为0.7036,建模效果仅次于对数模型。以光谱二阶导数建立的模型中,对数模型的建模效果最好,校正集决定系数Rc为0.6601,其次是多项式模型,Rc为0.6598。

将预测集样本特征参数输入已建立的模型中,得到的预测结果如表2所示。对于光谱一阶导数,幂函数模型预测效果较好,预测集决定系数Rv达到0.6858,均方根误差RMSE为0.0794;幂函数模型对马铃薯叶片叶绿素含量预测值与实测值关系如图5(a)所示。以光谱二阶导数建立的预测模型中,预测效果最好的为幂函数模型,预测集决定系数达到0.5829,均方根误差为0.0896,但其建模效果一般,不能作为最佳模型。综合考虑,选择决定系数RcRv较高、均方根误差RMSE较小的对数模型作为基于光谱二阶导数的最佳预测模型,其叶绿素预测值与实测值关系如图5(b)所示,预测集决定系数Rv为0.5723。

图 5 光谱导数最佳反演模型的叶绿素含量预测值与实测值 Figure 5 Predicted chlorophyll content and measured value in the optimal spectral derivative inversion model
3.2 基于植被指数的叶绿素含量反演模型

对GNDVI、MCARI、MTCI建立传统预测模型。对于GNDVI,对数与多项式模型建模效果较好,Rc分别为0.4234和0.4253;对于MCARI,建模效果较好的为对数与多项式模型,Rc为0.4851和0.4862;MTCI模型中,幂函数和多项式模型结果较好,其中幂函数模型Rc最大为0.4403。

将预测集样本数据输入反演模型中并检验各模型的预测性能,结果如表3所示。对于GNDVI,选择RcRv较高,RMSE较小的幂函数模型作为最佳模型。MCARI的模型中,多项式模型的预测集决定系数Rv为0.6248,RMSE为0.0898,同时校正集Rv高于其他模型,可作为最佳预测模型。MTCI的模型中,对数模型为最佳模型。

表 3 基于植被指数的叶绿素含量反演模型 Table 3 Chlorophyll content inversion model based on vegetation index

基于植被指数(GNDVI、MCARI、MTCI)建立的最优模型叶绿素含量预测值与实测值比较如图6所示,预测集决定系数分别为0.5329,0.6248,0.6816。植被指数中基于MTCI建立的预测模型相对较好。

图 6 植被指数最佳反演模型的叶绿素含量预测值与实测值关系图 Figure 6 Predicted chlorophyll content and measured value in the best inversion model of vegetation index
3.3 基于BR-BP神经网络的叶绿素含量反演模型

BP神经网络是一种反向传递并修正误差的多层映射神经网络,由三个部分组成,即输入层、隐含层、输出层,每一层都有多个处理单元,又称为神经元或节点,每个节点有多个输出通道,将输出信息送至下一层的每个节点[17]。每层网络都具有非线性传播函数。BP神经网络的工作分为两步:信息的正向传递和误差的反向传播。在正向传播过程中,输入信息从输入层经隐含层逐层计算传向输出层;如果在输出层没有得到期望的输出,则计算输出层的误差变化值,然后转向反向传播,通过网络将误差信号沿原来的传播路线反传回来修改各层节点的权值,直至达到期望目标[18]。因此,BP神经网络具有很强的非线性运算能力和极好的预测精度,是当下应用最广泛的神经网络。

但是,BP神经网络也存在一些缺陷,其中对预测结果影响最大的是它容易陷入局部最小值,出现过拟合现象。本文利用贝叶斯正则化方法对BP神经网络进行改进,具体原理如下。

设BP神经网络的误差函数为

式中:s2为输出层节点个数;ak为输出层第k个节点的输出;tk对应第k个节点的期望输出。在误差函数中添加一个参数惩罚项,使误差函数修正为

$E{\rm{ = }}\sum\limits_{k = 1}^{{s_2}} {{{\left( {{t_k} - {a_k}} \right)}^2}} $ (4)
$E{\rm{ = }}\alpha {\text{·}} \varOmega \left( \theta \right) {\text{·}} \sum\limits_{k = 1}^{{s_2}} {{{\left( {{t_k} - {a_k}} \right)}^2}} $ (5)

式中:α为正则化系数;Ωθ)为贝叶斯函数,其作用是将权值参数设置为随机变量,根据权值的概率密度确定最优的权值函数[19],使得BP神经网络预测结果误差更小。

贝叶斯正则化BP神经网络(BR-BP神经网络)的编程及模型的建立均在MATLAB R2015b中完成。选择与马铃薯叶片叶绿素含量相关性较高的高光谱特征参数,即498 nm光谱一阶导数值,MCARI、MTCI作为网络输入层,叶片叶绿素含量作为输出层,应用多次试错法,确定隐含层节点个数为8;将校正集样本数据输入神经网络中并对其进行训练,得出校正集决定系数Rc为0.8464,该模型具有优异的建模效果;将预测集样本数据输入训练好的网络中进行叶绿素含量预测,其决定系数Rv为0.6804,均方根误差RMSE为0.0746,对马铃薯叶片叶绿素含量有优异的预测效果。

4 结 论

本研究在BP神经网络中加入贝叶斯正则化防止其过拟合,提升神经网络的预测精度。对比传统预测模型的各项指标,BR-BP神经网络模型具有优异的建模和预测效果。但由于实验条件限制,样本数量相对较少,导致预测精度较传统预测模型并无很大提升。因此在后续研究中,需增加实验样本数量,提高神经网络训练精度,建立更加准确的马铃薯叶片叶绿素含量反演模型。

研究表明,依托高光谱技术,应用不同预测方法无损、快速、精确检测马铃薯叶片叶绿素含量是可行的,同时对其他农作物与各种绿色植物的叶绿素含量检测具有借鉴意义。研究结果也为马铃薯的科学生产以及其他作物的种植、生产提供科学依据。

参考文献
[1] 赵春江. 农业遥感研究与应用进展[J]. 农业机械学报, 2014, 45(12): 277–293. DOI:10.6041/j.issn.1000-1298.2014.12.041
[2] DAUGHTRY C S T, WALTHALL C L, KIM M S, et al. Estimating corn leaf chlorophyll concentration from leaf and canopy reflectance[J]. Remote Sensing of Environment, 2000, 74(2): 229–239. DOI:10.1016/S0034-4257(00)00113-9
[3] 徐晋, 蒙继华. 农作物叶绿素含量遥感估算的研究进展与展望[J]. 遥感技术与应用, 2016, 31(1): 74–85.
[4] MADEIRA A C, MENTIONS A, FERREIRA M E, et al. Relationship between spectroradiometric and chlorophyll measurements in green beans[J]. Communications in Soil Science and Plant Analysis, 2000, 31(5/6): 631–643.
[5] FILELLA I, PENUELAS J. The red edge position and shape as indicators of plant chlorophyll content, biomass and hydric status[J]. International Journal of Remote Sensing, 1994, 15(7): 1459–1470. DOI:10.1080/01431169408954177
[6] 牛鲁燕, 张晓艳, 郑纪业, 等. 葡萄叶片叶绿素含量高光谱估测模型研究[J]. 山东农业科学, 2018, 50(7): 152–156.
[7] 邹小波, 张小磊, 石吉勇, 等. 基于高光谱图像的黄瓜叶片叶绿素含量分布检测[J]. 农业工程学报, 2014, 30(13): 169–175. DOI:10.3969/j.issn.1002-6819.2014.13.021
[8] 宋开山, 张柏, 王宗明, 等. 大豆叶绿素含量高光谱反演模型研究[J]. 农业工程学报, 2006, 22(8): 16–21. DOI:10.3321/j.issn:1002-6819.2006.08.004
[9] 陈晓娜, 赵庚星, 周雪, 等. 基于高光谱的小麦冠层叶绿素(SPAD值)估测模型[J]. 天津农业科学, 2018, 24(2): 60–65, 79. DOI:10.3969/j.issn.1006-6500.2018.02.015
[10] 武旭梅, 常庆瑞, 落莉莉, 等. 水稻冠层叶绿素含量高光谱估算模型[J]. 干旱地区农业研究, 2019, 37(3): 238–243. DOI:10.7606/j.issn.1000-7601.2019.03.31
[11] 杨可明, 孙阳阳, 王林伟, 等. 玉米叶片叶绿素含量的高光谱反演模型探究[J]. 湖北农业科学, 2015, 54(11): 2744–2748.
[12] 董淼, 王振锡. 苹果冠层叶绿素含量高光谱估算模型[J]. 新疆农业科学, 2018, 55(6): 981–990.
[13] 岳学军, 全东平, 洪添胜, 等. 柑橘叶片叶绿素含量高光谱无损检测模型[J]. 农业工程学报, 2015, 31(1): 294–302. DOI:10.3969/j.issn.1002-6819.2015.01.039
[14] 童庆禧, 张兵, 郑兰芬. 高光谱遥感: 原理、技术与应用[M]. 北京: 高等教育出版社, 2006: 155 − 161.
[15] 郭铌. 植被指数及其研究进展[J]. 干旱气象, 2003, 21(4): 71–75.
[16] 张慧, 李平衡, 周国模, 等. 植被指数的地形效应研究进展[J]. 应用生态学报, 2018, 29(2): 669–677.
[17] 赵杰文, 林颢. 食品、农产品检测中的数据处理和分析方法[M]. 北京: 科学出版社, 2012: 113 − 126.
[18] 从爽. 面向MATLAB工具箱的神经网络理论与应用[M]. 2版. 合肥: 中国科学技术大学出版社, 2003: 56-59.
[19] 沈剑波, 雷相东, 李玉堂, 等. 基于BP神经网络的长白落叶松人工林林分平均高预测[J]. 南京林业大学学报 (自然科学版), 2018, 42(2): 147–154.