《NDVI和气象因子的相关关系分析.doc》由会员分享,可在线阅读,更多相关《NDVI和气象因子的相关关系分析.doc(9页珍藏版)》请在课桌文档上搜索。
1、遥感应用模型实习NDVI与气象因子相关性分析实习报告一、 实验操作部分1. 实验数据、表格及数据处理2. 实验操作过程(可用图表示)3. 结论1. 实验数据、表格和数据处理实验区域我们组分到的是随州2003年和2004年的MODIS影像和对应的地面站气象数据,包括每日气温和每日日照时间。由于我们需要建立的是NDVI与气象因子之间的关系,所以需要先利用MODIS影像的近红外和红波段求出NDVI,这里应该要对数据进行预处理,包括去除条带噪声,Bow-tie校正,太阳天顶角订正和几何校正等,但现有的数据已经做好预处理了,可以直接用就好。计算NDVI是利用ERDAS里的modeler模块,注意分母为0
2、的情况要去除。而气象数据是每日温度和每日日照时间,考虑气象因子的延时效应,需要计算累计值,这里我是用Excel直接进行的统计,注意最后求出的结果都要乘以0.1。在求出NDVI与积温、累计日照时间后,利用Matlab的CFTool模块进行相关关系拟合并计算R和RMSE,判断评价拟合效果。2. 实验操作过程2.1 MODIS影像的NDVI计算得到的MODIS影像已经经过数据预处理步骤,可直接利用Modeler Maker建立计算NDVI的模型,在建模时需要注意分母有可能为0的情况,所以添加判断语句:NDVI分母为0时,NDVI直接取值为0。又因为最后用于曲线拟合的NDVI值是整幅影像的NDVI值取
3、平均,而NDVI值小于0处一般认为不是植被,所以我又增加了一个判断,NDVI值0的像元不进入平均计算,这样可得到两种平均NDVI值,一为整幅图的NDVI取平均,另一个则是去除NDVI小于0的像元后再取平均得到的平均NDVI值。将对应日期的NDVI导入Excel中,便于之后的关系拟合。2.2 气象数据的积温、累计日照时间求解得到的地面站气象数据是每日的气温与每日日照时间,但考虑到温度和日照对植被的影响并不是立即见效的,总有延时效应,所以需要对温度和日照时间进行累加,计算积温和5日、10日和15日的累计日照时间,这些累加都是利用Excel完成的。2.3 Matlab拟合NDVI与气象因子关系取出E
4、xcel中影像对应的NDVI与积温、累计日照时间值,导入Matlab中。利用Matlab中曲线拟合的cftool模块,导入数据,选择拟合关系的形式,比如线性的、二次曲线、三次曲线等,即可实现曲线拟合,并计算出R和RMSE用于拟合效果评价。注意有一些气象数据比如03年12月的两个,因为没有对应的影像数据需要删除。3. 结论利用Matlab拟合积温、累积日照时间与NDVI的关系,由于经验模型的建立需要大量的样本,至少30个左右,而可以利用的03年和04年的影像数据加起来才能达到这一量级,所以在之后的拟合中,将03和04年的数据一起加入拟合,就不按年份分开来做了,否则可能会出现因样本数不足而使拟合效
5、果不可信的情况。3.1 NDVI与积温的相关关系拟合以累积温度作为x轴,NDVI作为y轴,以二次曲线对数据进行拟合,效果如下:图1 累计温度与NDVI的关系Goodness of fit:SSE: 0.08114R-square: 0.8449Adjusted R-square: 0.8339RMSE: 0.05383可以看到方程的可决系数R值为0.8449,而可决系数越趋近1,说明模型对数据的拟合效果越好。均方根误差RMSE为0.05383,RMSE越小,说明数据的离散程度越小。所以可以看到NDVI与积温之间确实有相关性,并且二者呈二次曲线关系,即在一定X围内,温度越高,NDVI也随之增加,
6、但到一定阈值后,积温越大,NDVI反而减小。这与实际情况也是相符的。在植物生长过程中,温度慢慢增加,利于植被的发芽长叶和叶绿素的合成,由此NDVI值也越发增大,但温度太高,超过植被生长的最高温度时,植被就有可能缺水甚至死亡,这样NDVI就会随温度增加反而下降。这是符合植物生理过程的,也说明这个模型可以接受。3.2 NDVI与累积日照时间的相关关系累计日照时间可以用3种不同时长累积,包括5日累计日照时间、10日累积日照时间和15日累积日照时间。3.2.1 NDVI与5日累积日照时间的相关关系以5日累计日照时间为x轴,NDVI为y轴,拟合效果如下: 图2 5日累积日照时间与NDVI拟合Goodne
7、ss of fit:SSE: 0.4451R-square: 0.1495Adjusted R-square: 0.1201RMSE: 0.1239可以看到5日累积日照与NDVI之间的相关性并不明显,从散点图来看几乎可以断言二者仅有微弱的相关性。而通过结合实际分析,日照时间确实应该与NDVI相关,所以,可能是因为数据太少,无法排除误差等因素造成的影响。为了验证去除了小于0的NDVI平均值是否能与累计日照时间有更好的相关性,将去除负值后的NDVI值也导入Matlab进行曲线拟合,效果如下:图3 5日累计日照时间与去除负值后的NDVI平均值的相关关系Goodness of fit: SSE: 0.
8、4429 R-square: 0.1499 Adjusted R-square: 0.1206 RMSE: 0.1236可以看到点分布还是十分离散的,拟合效果还是不如人意。但仅从R和RMSE等定量的评价指标来看,去除负值后的NDVI平均值衡量模型拟合效果的可决系数R增加了0.0004,反映数据离散程度的RMSE减少了0.0003,还是在向好的方向提升的。因为NDVI为负值的像元理论上认为它不属于植被,虽然MODIS一个像元对应的地面面积很大是250米x250米,很容易出现混合像元,但还是直接将负的NDVI认为非植被去除了,这样确实应该对拟合效果有所提高,但又因为对实际地表情况也不清楚,所以提升
9、效果不佳也是可能的。3.2.2 NDVI与10日累积日照时间的相关关系以10日累计日照时间为x轴,NDVI为y轴,拟合效果如下:图4 10日累计日照时间与NDVI的相关关系Goodness of fit: SSE: 0.5053 R-square: 0.03441 Adjusted R-square: 0.001118 RMSE: 0.132由图中样本点的分布可以看出,基本没有相关性。从定量指标R和RMSE来看,二者确实基本可以判断为无明显相关性。而因为结合实际情况,日照有利于植被生长与叶绿素的合成,理论上会越长的日照会使NDVI增加,所以选择利用一次曲线进行拟合,而效果类似5日日照时间的累计
10、值,分析原因有可能是数据的问题,但由于样本数不足,无法对其中的噪声、误差进行排除,所以拟合效果不好。类似的,希望分析去除负值后的平均NDVI值与10日日照累计时长的关系,看是否能对结果有所优化,二者的拟合效果如下:图5 10日累计日照时间与去除负值后的NDVI相关关系Goodness of fit: SSE: 0.5033 R-square: 0.03409 Adjusted R-square: 0.0007806 RMSE: 0.1317由散点图分布看,效果并无明显改善;而从定量指标分析来看,效果不仅没有改善,反而愈发差了。说明由于MODIS像元分辨率太低,混合像元情况很多,复杂的地面情况导
11、致仅以NDVI值为负判断植被是否存在是不可取的,所以拟合效果反而变差了。3.2.3 NDVI与15日累积日照时间的相关关系以15日累计日照时间为x轴,NDVI为y轴,拟合效果如下:图6 15日累计日照时间与NDVI的相关关系Goodness of fit:SSE: 0.4685R-square: 0.1048Adjusted R-square: 0.0739RMSE: 0.1271由散点图来看,15日累计日照时间与NDVI的相关性优于10日的,但还是相关性很低。由定量评价指标来看,15日日照时长累计值与NDVI仅微弱相关且数据离散。分析去除负值后的NDVI平均值与15日累计日照时间的相关性,拟
12、合效果如下:图7 15日累计日照时间与去除负值后的NDVI的相关关系Goodness of fit:SSE: 0.4668R-square: 0.1042Adjusted R-square: 0.07328RMSE: 0.1269可以看到去除负值前后的NDVI平均值与15日累计日照时间的拟合效果类似,说明希望通过NDVI为负判断植被存在与否,并通过去除这些负值提高精度是不可能的,这与地面复杂情况有关。三、实验效果分析(包括仪器设备等使用效果)将NDVI与温度、累计日照时间拟合效果建立一个表格,通过对比它们的可决系数R和RMSE来分析拟合效果。表1 NDVI与气象因子的相关性分析气象因子可决系数
13、R均方根误差RMSE积温0.84490.053835日累计日照时间0.14950.123910日累计日照时间0.034410.13215日累计日照时间0.10480.1271可决系数R适用于衡量模型的拟合程度的一个指标,R越趋于1证明拟合效果越好;均方根误差RMSE反映数据的离散程度,RMSE值越大,说明数据越离散。根据这样的评价指标,可以看到积温与植被指数是确实存在强相关性的,而累计日照时间,尤其是10日的累计日照时间与植被指数之间基本不相关。分析拟合结果,可以看到对于温度与NDVI的拟合使用的是二次曲线,因为结合实际生理情况,温度与植被生长确实满足二次曲线的关系:在一定的温度阈值内,温度越
14、高,植被的生理活动越强,植被生长越旺盛,表现出来的就是NDVI值的增加;但温度一旦超过阈值,过高的温度会破坏植物的组织,甚至导致植物缺水死亡,NDVI值会下降。在这样的实际情况下,温度与NDVI曲线的拟合是合理的,能够用植物的生理来解释的。而日照理论上与植被之间应是线性的关系,因为植被合成叶绿素需要紫外线的存在,日照时间越长,叶绿素合成越多,表现出来的NDVI值就越大。但在这样的实际情况下,选择一次直线拟合累计日照时间与NDVI的关系,却发现拟合效果不如人意,点分布十分离散,相关性也不高,这种情况有可能是数据存在问题。但由于样本数少,无法判断区分出噪声等的影响,所以只能认为是数据的原因,拟合不成立。为了改进拟合效果,将原图像中NDVI值为负的点都去掉,不参与计算NDVI平均值的运算。因为认为NDVI为负值的像元不属于植被,所以应予以去除。然后用去除了负值的NDVI平均值再次去拟合与NDVI的关系,发现拟合效果并没有太大的变化(变化都在小数点后3位),所以发现希望通过改进NDVI来改善拟合效果的尝试失败了。分析原因,我认为是因为MODIS的像元分辨率太低,十分容易出现混合像元,这时候直接认为NDVI为负值的像元没有植被存在是不合理的,地面的复杂情况也影响了最后计算得到的像元NDVI值,所以去除负值后取平均的NDVI对拟合与气象因子的关系在这里是没法改善结果的。