多尺度农作物物候期遥感降维预测方法
一、技术领域:
1.本发明涉及农作物生产技术领域,具体涉及的是多尺度农作物物候期遥感降维预测方法。
二、
背景技术:
2.农业是人类赖以生存和发展的基础,大范围农情信息的获取和预测对于指导农业生产和保证粮食安全具有重要意义。作物物候是指作物受环境和人类活动等的影响而产生的以年为单位周期性的自然现象,能够反应自然界的变化规律,对于农业生产、气候变化趋势分析都具有重要意义。
3.农作物物候是农作物生长的重要信息,农作物物候期的识别和预测是农作物种类的识别、分类以及农作物产量估计等的重要方法,是指导农业生产、施肥灌溉等田间管理、作物长势分析、产量估计和制定计划决策等的重要依据。
4.传统物候识别采用人工野外观测的方法,这种方式结果比较准确,但工作量大、主观性强、观测周期长并且观测范围较小,不适合大范围物候期的识别和预测。
5.遥感技术因其覆盖范围广、回访周期短以及成本低等优点,近年来成为了物候期识别和监测的重要手段。目前遥感物候监测的方法大概分为四类:阈值法、函数拟合法、植被指数变化法和模型法。这些方法多是利用植被指数(ndvi、evi等)建立时序植被指数曲线,通过分析植被曲线的变化来确定物候信息,或是用函数来拟合植被曲线,根据拟合函数的特征点来确定物候期。模型法是首先建立作物生长模型,通过将已标定物候信息的植被指数曲线和待标定的植被物候曲线拟合,来确定待标定植被的物候期。这些方法中存在物候信息提取不准确、易受植被曲线噪声影响、由于年际间和地域间作物环境改变而带来的不适应性等各自的局限和缺点。
6.近几年,深度学习在图像处理等领域显示出了强大的功能,深度学习模型由高度复杂的层次结构组成,能够从大量的原始数据中自动提取特征,强大的学习能力使其在解决复杂问题时表现出优势,适合处理分类和预测方面的问题。在农作物识别领域,有学者在田间建立观测点,通过数字相机等方式获取作物冠层图片,使用深度学习算法来建立作物物候识别模型,取得较好的效果。但这种方式适合定点和小范围的物候识别。如中国专利申请202110888719.3《一种基于改进卷积神经网络的小麦生育进程监测方法》基于定点拍摄,不适合大范围识别和预测。
7.有研究使用深度学习算法,根据多年气象数据预测农作物的物候期。如中国专利申请202011432779.6《基于深度学习的植物关键物候期时间点预测方法及系统》基于气象数据建立预测模型,没有考虑人为因素,品种、播种时间等。而农作物具体物候期的形成机理较为复杂,很难将所有要素考虑完全。
8.目前,使用遥感数据进行表征学习以期获得某个识别或预测结果的情况,比如物候期预测,作物产量预测等应用中,模型的训练和使用必须是基于同一个尺度的,例如有研究基于田块尺度训练的模型只能用于田块尺度的预测,基于县级尺度训练的模型只能用于
县级尺度的预测。
三、
技术实现要素:
9.本发明的目的是提供多尺度农作物物候期遥感降维预测方法,这种多尺度农作物物候期遥感降维预测方法用于实现不同尺度区域的农作物物候更精准的识别与预测,使物候识别和预测用到不同地域范围。
10.本发明解决其技术问题所采用的技术方案是:这种多尺度农作物物候期遥感降维预测方法包括如下步骤:
11.步骤一、获得某种农作物多个种植区域多年遥感数据和物候数据;
12.步骤二、对遥感数据预处理,预处理包括去云、辐射校正、重采样、投影转换、波段提取;
13.步骤三、对步骤二预处理后的遥感数据降维,生成可变时序长度的输入数据,每个输入数据为11维遥感向量,得到样本数据:所述遥感数据是包含二维地理坐标以及多个波段空间数据的三维数据类型;
14.步骤四、使用长短期记忆网络建立农作物识别和预测模型,充分考虑物候期形成的时间顺序以及物候期农作物表型前后的依赖关系,获得从播种到收获全物候期的遥感图片,构建的农作物识别和预测模型为多输出模型,将当前物候的识别功能和下一物候阶段预测功能集成在一个模型中;
15.步骤五、训练农作物识别和预测模型:将样本数据划分为训练集和测试集,使用训练集来训练物候期识别和预测模型;
16.步骤六、测试农作物识别和预测模型:对训练后的农作物识别和预测模型进行测试,当测试结果满足精度要求,则训练完成;
17.步骤七、农作物识别和预测模型的应用:农作物物候期识别及预测模型应用于任意生长阶段、任意大小区域的农作物物候期识别与预测。
18.上述方案步骤一中遥感数据为去掉东三省高程数据中海拔较高的地区,选择某农作物种植区60个气象站点所在田块作为研究区,获得研究区自当前年向前20年modis遥感数据,每年自4月1日到11月1日生长季中的28景,包含所有与生长环境、生长植被指数相关的11个波段的遥感数据,11个波段为mod09a1产品的波段1~波段7,myd11a2产品中的白天陆面温度、夜晚陆面温度、mod13a1和myd13a1中的归一化植被指数ndvi、增强植被指数evi;物候数据是研究区自当前年向前20年历史物候数据。
19.上述方案步骤三中遥感数据降维的方法:采用均值降维的方式,将所述研究区域所有像素点的取值进行均值化处理,将二维坐标空间的数据用一个均值来表示,使用均值来代表研究区域的整体水平,从而确定物候的变化。
20.使用均值降维的方式将三维数据降至二维数据:
[0021][0022]
其中,p为研究区域在某个波段的平均取值,i,j为研究区域内某农作物掩膜下的像素点位置的横纵坐标,x
ij
为该像素点的某个波段取值,n为研究区域内某农作物掩膜覆盖下的像素点个数;
[0023]
将每一个波段的数据分别进行归一化处理,使结果值映射到[0-1]之间,计算的公式为:
[0024][0025]
其中,p
*
为归一化后的结果,max为该波段取值的最大值,min为该波段取值的最小值;
[0026]
使用向量法将二维数据降至一维,用11维向量来分别表示包含11个波段的二维数据,11维向量中的元素为p1,p2,p3......p
11
,作为一维数据输入网络模型。
[0027]
上述方案中步骤四中农作物识别和预测模型的结构:28个序列输入,28个序列输出,隐藏层为28个相同结构的记忆单元,每个记忆单元包含一个输入和一个二维输出,前后28个记忆单元向后传递细胞状态和上一级输出两个并行的信息,这两个并行的信息作为下一级单元的输入,输出状态不仅由本级输入决定,还与前序的信息相关输入的时序变量;
[0028]
每个记忆单元由三部分组成:遗忘门:决定从细胞状态保留多少原始信息;输入门:决定当前记忆单元需要更新的信息,决定多大程度的忽略掉当前输入的数据;输出门:决定多大程度的输出记忆单元中的信息;
[0029]
每一个记忆单元的输出具有两个维度,物候期类型识别属于多分类问题,物候期预测属于标量回归问题;总损失值设置为两个维度损失值加权之和,loss总=w1
×
loss1 w2
×
loss2,根据它们的下降速率比值来调整它们在总损失中的权重w1和w2;分类问题损失函数loss1为softmax函数,回归问题使用残差作为度量,loss2=y-f(x),其中y为标定的预测值,f(x)为模型每次运行所得到的预测结果;
[0030]
模型的输入:每年长度为28的时序遥感数据序列作为一个输入序列,序列中的每一个输入为包含11个波段的一维遥感向量数据(p1,p2,p3......p
11
);
[0031]
模型的输出:模型为28输出,每一个输出都包含物候分类结果和下一物候期开始时间的回归预测结果。
[0032]
上述方案中训练农作物识别和预测模型的方法:使用训练集中的960个时序数据对农作物识别和预测模型进行训练,每一组28个输入,对应28个输出,根据总loss值更新农作物识别和预测模型全部的参数,训练农作物识别和预测模型;农作物识别和预测模型里的参数使用一组参数进行调节和训练,训练一组权重参数。
[0033]
有益效果:
[0034]
1、本发明所提出的遥感数据降维的方法,使得在某一个尺度上训练好的模型能够应用于不同尺度的物候识别及预测。根据不同的应用需求和使用主体,可以满足田块尺度、村镇县市省等各级行政级别尺度监测和预测的需求。同时,这种降维的方式具有更一般化的应用,不仅用于物候的识别和预测,只要是使用遥感数据进行表征学习以期获得某个识别或预测结果的情况,比如作物产量预测,长势监测以及森林生物量估算等等,都可以使用本发明提出的遥感数据降维方式,实现在一个尺度上训练模型在多个尺度应用的目的。
[0035]
2、本发明使用长短期记忆网络建立物候识别和预测模型,充分考虑物候期形成的时序相关性以及物候期农作物表型前后的依赖关系,考虑作物表型在时间上的连续性和决定性,并且包含离当前时间距离越近的表型数据对于物候期判断的影响越大的原理,使得预测模型更能表达客观状态,预测更准确,应用性更强。
[0036]
3、本发明采用深度学习 遥感数据的方式,不用考虑复杂的物候形成机制,从农作物生长的表现状态中获得大量客观的生长信息,进行表征学习。数据易获取成本低,大数据量为模型提供充足的训练样本,使得模型具有更好的泛化能力,系统具有更广泛的应用性。
[0037]
4、本发明中物候识别功能和预测功能的集成,将物候识别功能与物候预测功能在一个模型中实现,通过一个网络模型,预测数据的不同性质。模型以一年当中的生长期内所有遥感数据时序序列作为一组时序数据输入模型,为使得模型在最后使用阶段能够适应任意时间物候期的识别和预测,模型采用和输入时序数据相同个数的输出,保证使用时每一个阶段输入当前的遥感图片,都能够获得当前物候期的分类和预测。为了让模型同时完成识别和预测的功能,每一个输出中都包含两个维度,第一个是物候期的识别,第二个是物候期的预测。识别属于多分类问题,预测属于回归问题。因此模型在设计上,输出要使用两类损失(loss)函数,训练模型时分别计算,再将两类loss值处理后,根据贡献程度以一定的函数将其整合,根据结果调整整个模型,最后训练得到集成物候识别和预测功能的模型。
[0038]
5、本发明通过对遥感数据进行降维处理的方式,实现了在一个尺度上训练模型,在多个尺度来使用模型的目的。训练阶段,使用一定区域的遥感数据,降维后作为模型的输入进行模型训练。使用阶段,获得任意尺度农作物的遥感数据,通过同样数据降维的方式处理数据输入该系统,则该系统能够给出任意尺度农作物的物候期识别和预测结果。避免了训练多个模型所带来的效率的损耗。
[0039]
6、本发明基于时序遥感数据建立农作物物候识别和预测模型,实现不同尺度区域的农作物物候更精准的识别与预测。在田间尺度指导农业生产、施肥灌溉等田间管理,辅助管理措施决策,预先安排大田劳作中的人力和机械。在区域尺度上为作物识别提供依据,在宏观尺度上,监测作物长势、预测产量、指导宏观决策。
四、附图说明:
[0040]
图1是物候识别及预测模型结构。
五、具体实施方式:
[0041]
下面结合附图对本发明做进一步说明:
[0042]
本发明是基于遥感降维的多尺度农物物候期预测方法,获得某种农作物种植区域历史遥感数据和物候数据,将遥感数据进行均值降维处理,基于降维后的时序遥感数据,构建多尺度的动态的农作物物候期识别和预测模型。
[0043]
这种多尺度农物物候期遥感降维预测方法包括如下步骤:
[0044]
以东三省为研究区,以玉米为例,包含数据获取、数据预处理、基于长短期记忆网络构建识别和预测模型以及系统的使用几个部分。
[0045]
1、获取遥感数据及数据预处理
[0046]
为了使最后的模型适合不同尺度,本发明使用的遥感数据既需要小范围地块,又需要各级行政区域的尺度(省、市、县等)。
[0047]
去掉东三省高程数据中海拔较高的地区,选择玉米种植区60个气象监测站所在的田块作为研究区,获得研究区自当前年向前20年modis遥感数据,一年生长季(4月1日到11月1日)中的28景,包含所有与生长环境、生长植被指数相关的数据相关的11个波段的遥感
图片,进行遥感数据的预处理(去云、辐射校正、重采样为500m分辨率、投影转换、波段提取等)
[0048]
总共获得60*20*28=33600张,包含玉米的5个物候阶段的11个波段的三维遥感图片。以每年的作物生长季28期遥感作为一组时序数据,总共60*20=1200组时序样本。
[0049]
11个与物候期相关的波段包括:
[0050]
mod09a1:500m空间分辨率,8天时间分辨率,包含7个波段地表反射率数据,能够反应土壤湿度等作物环境信息
[0051]
myd11a2:100m空间分辨率重采样为500m分辨率,8天时间分辨率,包含2个波段,白天和夜间的地表温度数据。
[0052]
mod13a1和myd13a1:500m空间分辨率,8天时间分辨率,均包含2个波段,归一化植被指数ndvi和增强型植被指数evi,能够反应农作物生长状况和生长阶段,与农作物的物候具有直接关系。
[0053]
历史物候数据:研究区自当前年向前20年历史物候数据。
[0054]
2、遥感数据降维
[0055]
遥感数据是包含二维地理坐标,以及11个波段空间数据的三维数据类型。为了使得最后的识别和预测模型适合于不同区域尺度,需要对遥感数据进行降维。
[0056]
训练数据使用田块尺度数据,采用均值降维的方式将田块种植区域所有像素点的取值进行均值化处理,将二维坐标空间的数据用一个均值来表示。用研究区域的均值代表该区域的整体水平,以确认该区域的物候及其变化。
[0057][0058]
其中,p为研究区在某个波段的平均取值,i,j为研究区域内玉米掩膜下的像素点位置的横纵坐标,x
ij
为该像素点的某个波段取值,n为研究区域内玉米掩膜覆盖下的像素点个数。
[0059]
将每一个波段的数据分别进行归一化处理,使结果值映射到[0-1]之间,计算的公式为:
[0060][0061]
其中,p
*
为归一化后的结果,max为该波段取值的最大值,min为该波段取值的最小值。
[0062]
使用向量法将二维数据降至一维,用11维向量来分别表示包含11个波段的二维数据。向量(p1,p2,p3......p
11
),作为一维数据输入网络模型。
[0063]
3、使用长短期记忆网络构建玉米物候期识别和预测模型:模型考虑一年生长季中的28景时序遥感数据的时序相关关系,基于长短期记忆网络构建时序模型。模型是二输出的,包括具体物候阶段预测和当前物候期的结束时间预测(即下一物候期的开始时间),分别对应分类预测和回归预测。
[0064]
1)样本:60个玉米种植区田块20年遥感数据,一年生长季中的28景作为一个时序序列,总共1200个时序样本,总共获得60*20*28=33600张遥感图片。由于模型为二输出,每张遥感图片都具有二个标签,第一个标签是当前遥感图片所处的物候期(玉米的五个物
候期 空窗期),第二重标记是当前物候期的结束时间(即下一物候期的开始时间),分别用pheno_label,time_label给表示,标签用一个二元数组来表示。将时序样本按照4:1划分为训练集和测试集,分别为训练集trainset={960},测试集testset={240}。
[0065]
2)模型输入:每年长度为28的时序遥感数据序列作为一个输入序列,序列中的每一个输入为包含11个波段的一维遥感向量数据(p1,p2,p3......p
11
)。
[0066]
3)模型输出:模型为28输出,每一个输出都包含物候分类预测结果和下一物候期开始时间的回归预测结果。
[0067]
4)模型结构:
[0068]
a)模型包括,28个序列输入,28个序列输出,隐藏层为28个相同结构的记忆单元也即28个神经元,每个单元包含一个输入和一个二维输出,前后28个记忆单元向后传递“细胞状态”和“上一级输出”两个并行的信息作为下一级单元的输入,输出状态不仅由本级输入决定,还与前序的信息相关输入的时序变量为{x1,x2,...x
28
},其中在时刻t神经元的输入时间序列为x
t
=[i
t
(1),i
t
(2),...i
t
(11)]。物候识别及预测模型结构如图1所示。
[0069]
b)记忆单元内部的原理结构如图1所示,包含三个部分。
[0070]
遗忘门:决定从细胞状态保留多少原始信息,遗忘多少原始信息,由当前时刻的输入和前一时刻的输出决定。
[0071]
输入门:决定当前记忆单元需要更新的信息,要多大程度的忽略掉当前输入的数据。
[0072]
输出门:决定多大程度的输出记忆单元中的信息。
[0073]
每一个记忆单元按照t=1-28依次递归计算记忆单元当中的三个门所有参数值。t时刻不同参数的计算表示为:
[0074]ft
=σ(wf·
[h
t-1
,x
t
] bf)
[0075]jt
=σ(wj·
[h
t-1
,x
t
] bj)
[0076][0077]ot
=σ(wo·
[h
t-1
,x
t
] bo)
[0078][0079]ht
=o
t
×
tanh(c
t
)
[0080]
其中,f
t
为遗忘门值,i
t
为输入门的值,为记忆单元值,o
t
为输出门值,c
t
当前时刻记忆单元的值,wf为遗忘门对应的权重矩阵,wi为输入门对应的权重矩阵,wc为记忆单元对应的权重矩阵,bf为遗忘门对应的偏置值,bi为输入门对应的偏置值,bc为记忆单元对应的偏置值,wo为初始权重矩阵,bo初始权重偏置,h
t-1
为前一个时刻的输出,x
t
为当前时刻的输入,h
t
为当前时刻的输出;σ指的是sigmoid激活函数。
[0081]
c)每一步的输出(t=1,2...28)端口具有两个维度,物候期预测属于标量回归,物候期类型属于多分类问题。每个输出端口加入softmax分类器,输出分类结果,加入回归预测出口,输出回归结果。所以对应于不同的损失函数,需要训练的过程也不同,但是梯度下降要求仅仅对一个标量进行最小化,所以我们将这两个不同的损失值合并称为一个标量。
总损失值设置为两个维度损失值加权之和,loss总=w1*loss1 w2*loss2,根据它们的下降速率比值来调整它们在总损失中的权重w1和w2。
[0082]
loss1:物候类型判断属于分类问题,损失函数loss1为softmax函数,将每个所对应的输出分量归一化,使各个分量的和为1,将任意输入值转化为概率。
[0083]
loss 2:物候期预测问题,属于回归分体,回归问题中实际值y和预测值f(x)皆为实数∈r,因此用残差loss2=y-f(x)来度量二者的不一致程度。
[0084]
4、模型的训练:使用训练集trainset中的960个时序数据对模型进行训练,每一组28个输入,对应28个输出,根据总loss值更新模型全部的参数,训练模型。模型里的参数使用一组参数进行调节和训练,训练一组权重参数。样本形状shape=(28,11),需要调整的参数个数为neurons_all=4
×
((m m)
×
m m),其中,m=28,n=11。训练在windows10操作系统上,基于python3.6和tensorflow框架来实现。训练过程自动调整模型参数权重和两个loss值得权重。初始学习率设置为0.001,分阶段逐次调整为原来得10倍,分别为2000次,10000次和20000次时调整。当模型训练10000次时收敛。
[0085]
5、模型的测试:使用240组时序数据,每组28个输入数据,测试模型的精度。对训练后的模型进行测试,当测试结果满足精度要求,则训练完成。不同物候阶段的所有测试结果作为总的结果统一参与评价。物候期预测结果采用相关系数
r2
和均方根误差rmse来评价,物候期识别属于多分类问题采用识别率作为评价指标。测试集最后平均结果为,r2为0.93,rmse为1.8天,分类精度0.97。训练和测试完成后,生成精度较高,适用性好的物候识别和预测模型。
[0086]
6、模型的应用
[0087]
玉米物候期识别与预测系统包含以下几个部分:数据获取,数据处理,当前物候期识别和下一物候期预测。
[0088]
系统的使用流程:
[0089]
1)获取想要预测的区域当前遥感数据,预测的区域可以满足多种尺度;
[0090]
2)使用玉米作物分布掩膜,提取想要预测区域玉米种植区域下的所有遥感数据;
[0091]
3)使用前面所述的遥感数据降维方法,将遥感数据降维;
[0092]
4)将当前遥感图像及从播种到当前的所有景的遥感图像降维后,生成可变时序长度的输入数据,每个输入数据为11维遥感向量,输入物候期识别和测模型,模型根据输入数据的时序长度,自动获取当前的物候期类型和下一物候期的预测时间。
[0093]
本发明基于时间序列遥感数据,采用数据驱动的方式,忽略物候期形成的复杂机理,通过作物生长的外部表现特征为识别依据进行表征学习。充分考虑物候期形成的时间顺序以及物候期农作物表型前后的依赖关系,获得从播种到收获全物候期的遥感图片,使用长短时记忆网络构建二输出模型,将当前物候的识别功能和下一物候阶段预测功能集成在一个模型中。
转载请注明原文地址:https://tc.8miu.com/read-2077.html