基于神经网络的LAI遥感反演影响因素分析
- 格式:docx
- 大小:41.44 KB
- 文档页数:7
基于神经网络的LAI遥感反演影响因素分析
陈士城; 王宝水
【期刊名称】《《地理空间信息》》
【年(卷),期】2019(017)012
【总页数】3页(P72-74)
【关键词】BP神经网络; PROSAIL; 叶面积指数 LAI; 遥感反演
【作者】陈士城; 王宝水
【作者单位】苏州中科天启遥感科技有限公司江苏苏州 215000; 江阴市城市规划信息咨询中心江苏江阴 214400
【正文语种】中文
【中图分类】P237
目叶面积指数(leaf area index,LAI)是描述植被冠层结构的重要参数之一,其
定义为单位面积上方植被叶片表面积的总和(即全部表面LAI),或者可定义为单位面积上总叶片表面积的一半[1]。
作为反映农作物长势和农作物估产的重要参量,如何快速、有效、准确地获取LAI信息已成为当前的重要工作[2]。
其中,遥感观
测技术具有速度快、观测范围大、周期性短等优点,为动态估测和快速监测提供了强有力的工具。
叶面积指数LAI的反演一直是遥感应用领域的热点、难点问题。
目前,主要有经
验模型法、物理模型法和综合反演法等[3]。
经验模型法通常是在光谱和相关生化
参量之间建立回归经验模型,是目前较为成熟的一种方法。
但该方法受限于饱和效应、场景和遥感传感器等方面的影响。
物理模型法是指以物理方法为依据的模型参数反演,该方法理论基础完善,具有明确的物理意义。
但该方法在反演过程存在迭代不收敛、结果不确定等缺陷,且对于大区域的图像数据来说反演非常耗时。
综合反演法包括神经网络、投影追踪和回归树方法等。
该类方法具有反演速度快、无需参数初始值和能有效考虑关键变量的变化等优点。
在综合反演方法中,基于BP神经网络和PROSAIL模型相结合的叶面积指数LAI 反演方法已被广泛采用[3]。
杨贵军等利用该反演方法成功反演了多种农作物的LAI,取得了较好的结果[4-6]。
但是,在反演过程中仍存在某些问题需要进一步分析,包括训练数据的模拟、网络结构的设计、参数估计及网络性能评价等。
其中,最关键的部分就是网络结构的设计,它对整个反演结果起着重要的作用。
在以往的研究中,并没有深入研究网络结构对结果的影响,如隐含层层数、隐含层节点数和学习速率等方面。
本文主要从网络结构的设计方面出发,详细分析了BP神经网络在反演LAI时的影响因素,通过对可影响网络性能的多种因素进行分析比较,确定最佳的BP网络结构。
其中,具体分析了隐含层层数、隐含层节点数和学习速率等3个方面对网络的影响。
1 模型简介与数据准备
1.1 PROSAIL模型简介
植被辐射传输模型PROSAIL是由叶片光学特性模型PROSPECT(leaf optical properties model)和冠层反射模型SAIL(canopy bidirectional re fl ectance model)耦合而成[7],该模型已广泛应用于植被生化组分提取、冠层结构估计等多个方面。
PROSPECT模型是一个用于计算叶片反射率(ρ1)和透射率(t1)的辐射传输模型,由Jacquemoud等首先提出[8]。
SAIL模型用于计算植被冠层二
向反射率ρ(λ)的辐射传输模型,由Verhoef在Suit模型的基础上提出。
PROSAIL耦合模型的表达式为:
各个参数含义如下:N为叶片结构参数;Cab为叶绿素含量;Cw为等效水厚度;Cm为干物质含量;Cbp为棕色素含量;LAI为叶面积指数;hspot为热点效应参数;LAL为平均叶倾角;ρs为土壤反射率;SKYL为天空光比例;θs为太阳天顶角;θv为冠层天顶角;θsv为反射方位角。
1.2 数据准备
本文采用的数据包括两部分,模拟数据和实测数据,模拟数据用于神经网络的训练和检验。
在实验中,采用高斯分布随机生成3 500种模型输入参数组合,其中3 000个数据用于训练神经网络,500个用于神经网络仿真模型的验证。
PROSAIL
模型各输入参数的取值范围如表1所示。
首先根据随机生成的模型输入参数模拟
出相应的冠层光谱,然后将冠层光谱作为BP网络的输入、对应的参数作为网络的输出,建立BP神经网络。
本文中的所有实验均采用Matlab神经网络工具箱提供的newff函数来创建BP网络,训练函数采用Scaled共轭梯度算法函数trainscg,隐含层神经元的传递函数采用tansig,输出层的传递函数是purelin,其他函数采用默认。
实测数据是由欧洲航空局(ESA)Sentinel-3 Experiment提供。
实验区域位于西班牙(Spain)西南部的巴拉克斯地区(Barrax,30°3′N、2°6′W),该地区地势平坦,海拔高度为700 m,观测时间是2009-06-20~24,观测植被包括玉米、
大蒜和向日葵等农作物。
在该实验中,测量了植被冠层的反射率、叶片的反射率或透射率、土壤反射率、叶绿素含量、水含量、叶面积指数以及气象数据等,如表1所示。
表1 模拟数据各输入参数范围参数 N Cab Cw Cm LAI ALA hspot最小值 1.0 20
0.003 0 0.002 0 0.1 30 0.001最大值 2.5 90 0.050 0 0.020 0 8.0 80 1.0平均值
1.5 40 0.015 0 0.007 5
2.0 60 0.1标准差 1.0 30 0.015 0 0.007 5 2.0 20 0.3
2 实验分析与讨论
BP神经网络的拓扑结构直接影响网络对函数的逼近能力和效果。
因此,在实际应
用中,应根据具体问题,确定一个最佳的网络结构。
在本文中,主要考虑了BP网络的隐含层数、隐含层节点数和学习速率3个因素对网络性能的影响。
在分析网
络训练的性能时,主要从训练次数(Epoch)、消耗时间(s)、达到的性能函数
目标值(MSE)等参数进行了比较。
在分析网络的反演能力时,主要对均方根误
差(RMSE)和相关系数(R)等精度参数进行比较,本文实验流程如图1所示。
图1 神经网络反演流程图
2.1 隐含层节点数的影响与分析
隐含层节点的作用是从训练样本中提取并存储其内在的规律,隐含层节点数是反映网络映射能力的重要参数。
隐含层节点数量太少,不足以反映样本的规律;数量过多,也会出现所谓的“过拟合”问题,反而降低了网络的泛化能力。
此外,隐含层节点数过多会增加神经网络的训练时间。
针对这个问题,本文分别分析了当网络结构为单隐层和双隐层时不同的节点数对网络性能和反演结果的影响。
在实验中,单隐层节点数分别设为[10,30,50,70,90],在图2中由数字1~5表示;双隐层节点
数分别设为[(10,10)、(10,30)、(10,50)、(30,10)、(30,30)、(30,50)、(50,10)、(50,30)、(50,50)],在图 3 中由数字1~9表示。
图2、3中的“耗时”、“训练
次数”等参数的数值都经过了适当调整,方便在图中显示。
图2表示的是当网络为单隐层时不同节点数对结果的影响。
在该实验中,固定训
练次数为50 000。
从图中可以看出,随着节点数的增加,训练消耗的时间也在增加,而对应的网络性能函数目标值MSE基本相当;对于检查数据的反演结果而言,随着节点数的增加,相关系数R基本相等,均方根误差RMSE反而降低了。
究其
原因,随着节点数的增加,网络的泛化能力反而降低了。
图3表示的是当网络为双隐层时不同节点数对结果的影响,在该实验中固定了网
络性能函数目标值MSE为0.000 5。
从实验结果可以看出,在网络达到相同的性
能目标值时,不同节点数对网络性能的影响比较显著。
当隐层节点数为(30,10)时,网络的训练消耗时间和训练次数最少。
对于检查数据,均方根误差RMSE小
于或基本等于其他几种情况,相关系数R基本相等。
出现这种情况的原因是训练
的结果和训练数据的数据量大小与分布情况有关,不同的输入数据需要有不同的网络结构。
图2 单隐层时不同节点数对结果的影响
图3 双隐层时不同节点数对结果的影响
2.2 隐含层层数的影响与分析
隐含层层数是网络结构的重要参数。
一般认为,增加隐含层层数可以降低网络训练误差,提高精度,但也会使网络复杂化,从而增加网络的训练时间和出现“过拟合”的问题。
根据Robert Hecht-Nielsen的理论,一般情况下最多需要2个隐含层。
在本文中,分别分析了单隐层和双隐层网络结构对反演结果的影响。
在图2中,
当训练次数为50 000时,达到的网络性能目标值MSE为0.001左右;而在图3中,当训练次数为10 000左右时,网络的目标值就已经达到了0.0001,在速度
上比单隐层有了很大的提高。
因此,相比较单隐层网络而言,双隐层结构的网络可以在更少的训练时间和次数下达到更小的目标值MSE。
2.3 不同学习速率的影响与分析
对于一个非线性网络而言,选择一个合适的学习速率是一项具有挑战性的工作,过高的学习速率会导致学习过程的不稳定。
相反,学习速率过低会导致训练过程消耗过长的时间。
在本节实验中,主要分析了网络为双隐层时不同的学习速率对网络性能及反演结果的影响。
在该实验中,隐含层节点设为(30,10),网络性能目标值
MSE为0.000 1,学习速率设为[0.01,0.1,0.2,0.3,0.4],如图4所示。
从图中可以
看出,当学习速率为0.01时,网络训练次数和消耗时间是最少的,同时检查数据
的均方根误差RMSE和相关系数R同其他几个学习速率的结果相当。
图4 实测数据LAI反演结果
2.4 实测数据反演
根据上述分析与讨论,在反演实测数据时选用双隐层网络,隐含层节点数为(30,10),学习速率设为0.01,网络性能函数目标值设为0.000 1。
在该实验中,将实际测量的光谱数据代入到训练好的BP网络中进行反演计算,最后得到该地区的LAI反演结果,均方根误差RMSE为1.21,相关系数R为0.755,如图5所示。
图5 实测数据LAI反演结果
3 结语
人工神经网络技术已应用在遥感的多个方面,本文以BP神经网络为工具,结合植被冠层辐射传输模型PROSAIL反演植被叶面积指数LAI,取得了较好的反演结果。
在实验中,针对BP神经网络中网络结构设计的关键问题,从网络隐含层层数、隐含层节点数和学习速率3个方面进行了详细分析,确定最佳的BP网络结构。
可以得出,在利用BP神经网络进行反演时,应采用双隐层网络结构,学习速率设为0.01,隐含层节点数应根据输入节点数和输出节点数视情况而定,需要多次实验来确定,本文实验采用的节点数为(30,10)。
另外,本文的最佳网络结构是经过多次实验得到的,并没有从更深的网络内部结构来解释如何设计更优的网络,这一点有待后续的研究。
参考文献
【相关文献】
[1] Chen J M, Black T.A Defining Leaf Area Index for Non-Flat Leaves[J].Plant Cell Environ, 1992(15):421-429
[2] 邢著容, 冯幼贵.高光谱遥感叶面积指数(LAI)反演研究现状[J].测绘科学, 2010(35):162-164
[3] 王宝水,刘旭,杨红军.一种基于高光谱遥感数据的植被LAI反演算法[J].地理空间信息, 2016,
14(11):72-73
[4] 方秀琴, 张万昌.叶面积指数(LAI)的遥感定量方法综述[J].国土资源遥感, 2003(3):58-62
[5] 杨贵军, 赵春江.基于PROBA/CHRIS遥感数据和PROSAIL模型的春小麦LAI反演[J].农业工程学报, 2011, 27(10):88-94
[6] 刘洋, 刘荣高.基于物理模型训练神经网络的作物叶面积指数遥感反演研究[J].地球信息科学学报, 2010, 12(3):426-435
[7] Aleixandre V, Frédéric B.Optimal Modalities for Radiative Transfer-neural Network Estimation of Canopy Biophysical Characteristics: Evaluation Over an Agricultural Area with Chris/Proba Observations[J].Remote Sensing of Environment,2011(115):415-426 [8] Jacquemoud S, Verhoef W.Prospect+Sall Models: A Review of Use for Vegetation Characterization[J].Remote Sensing of Environment, 2009(113):56-66
[9] 马维维, 张连蓬,等.植物叶片生化组分遥感反演的波段选择[J].测绘科学与技术学报, 2011,
28(3):208-212。