本发明涉及水文技术,具体涉及一种自动识别流域特征权重的水文模型参数区域化方法。
背景技术:
1、国际水文协会(iahs)发起的无资料流域水文预报十年计划(predictions inungauged basins,pub)倡导通过流域水文相似性进行无资料地区的水文预报。尽管该计划已经结束,但iahs承认在无资料流域水文预报的研究中仍未出现突破性进展,因此无资料流域水文预报至今仍是一项全球性挑战。这一挑战能否解决在很大程度上取决于水文信息是否能成功地从水文气象资料丰富的流域外推到无资料流域,这一过程通常被称为区域化。在众多水文信息中,最方便可行的是对水文模型的参数进行区域化。如何将水文模型参数从资料丰富的流域移用至无资料流域,是目前无资料流域水文预报研究中的重要方面,也是在无资料地区构建合理可靠的水文模型时不可避免的重点、难点问题。
2、为进一步促进无资料地区水文模型的发展,需要更深入研究无资料地区水文模型参数区域化估算方法。目前,在参数区域化研究中,各流域特征的重要性权重主要通过专家经验进行设置或简单地设置为等权重,具有较大的主观性,难以合理量化不同流域特征在参数移用方案中的重要性,增加了参数区域化方案的构建难度及主观性,不利于水文模型在无资料地区的推广应用及研究发展。
3、针对以上不足,如何客观量化流域特征的权重,客观准确地将水文模型参数由水文气象资料丰富的流域移用至无资料流域,实现无资料流域水文模型参数的合理估算,正是发明人需要解决的问题。
技术实现思路
1、发明目的:本发明的目的在于解决现有技术中存在的不足,提供一种自动识别流域特征权重的水文模型参数区域化方法,具有数据来源稳定可靠、计算效率高、结果客观合理等优点,有利于无资料流域的水文模型参数的确定及提高该流域洪水模拟的准确性,值得推广。
2、技术方案:本发明的一种自动识别流域特征权重的水文模型参数区域化方法,包括以下步骤:
3、步骤1、首先选取与待测无资料流域uc在同一水文气象区的多个(至少5个)有水文气象资料流域,依次记为[c1,c2,c3,…,ck],然后分别在流域[c1,c2,c3,…,ck]对任意水文模型m(.)的待估参数组par=[p1,p2,p3,…,pp]进行自动率定,进而得到全部流域的最优参数组pp表示水文模型m(.)的第p个待估参数;表示流域ck的最优参数组;
4、步骤2、先基于流域下垫面信息提取流域[c1,c2,c3,…,ck]各自对应的流域特征值,每个流域所提取的7个流域特征均依次为;流域面积x1、流域平均高程x2、河道平均坡度x3、面积坡度x4、河网密度x5、林地面积比x6、流域平均饱和渗透系数x7;得到流域特征组{[x11,x12,…,x17],…,[xk1,xk2,…,xk7]};
5、然后,提取待测无资料流域uc的流域特征值,分别记为流域面积y1、流域平均高程y2、河道平均坡度y3、面积坡度y4、河网密度y5、林地面积比y6、流域平均饱和渗透系数y7;
6、步骤3、定量计算步骤2所得各个流域特征值对水文模型m(.)的待估参数的重要性权重;具体方法如下:
7、步骤3.1、对于流域[c1,c2,c3,…,ck],先将各流域的流域面积特征组成特征向量x1_all,然后随机打乱向量x1_all中元素的顺序生成x1_all的影子向量x1_shadow;同时,对其他六个流域特征做同样处理,得到特征向量x2_all,x3_all,…,x7_all和影子向量x2_shadow,x3_shadow,…,x7_shadow;此处获取影子向量以便于后续区分流域特征是important还是unimportant,进而影响权重计算;
8、步骤3.2、将特征向量x1_all,x2_all,…,x7_all和影子向量x1_shadow,x2_shadow,…,x7_shadow作为自变量,第一个待估参数p1作为因变量,训练随机森林模型,计算各个特征向量和影子向量基于不纯度的特征重要性分数δi(xi);
9、步骤3.3、将影子向量x1_shadow,x2_shadow,…,x7_shadow中,特征重要性分数的最大值记为shadowmax;
10、步骤3.4、重复步骤3.1至3.3共100次,计算shadowmax的中值,记为shadowmax__med,并分别与特征向量x1_all,x2_all,…,x7_all的特征重要性分数的中值进行比较,如果第i个特征向量的特征重要性分数中值δi_med(xi)≥shadowmax__med,则该特征向量对应的流域特征xi对待估参数p1重要,标记为important;反之则标记为unimportant;i∈[1,7];
11、步骤3.5、按对参数p1是否重要分情况分别计算流域特征x1到x7的特征权重ω;
12、步骤3.6,针对剩余的待估参数p2,p3,…,pp重复步骤3.2至3.5,直至各流域特征对全部待估参数的特征权重计算完毕,将流域特征xi的最终权重作为各个待估参数特征权重的平均值,所有特征权重组成特征权重向量w=[w(x1),w(x2),…,w(x7)];
13、步骤4,基于流域特征权重及秩累计相似性矩阵,将水文模型m(.)的待估参数从水文气象资料丰富的流域[c1,c2,c3,…,ck]移用至无资料流域uc,具体方法为:
14、步骤4.1、分别计算流域c1至ck第1个流域特征的流域特征x1与无资料流域uc的流域特征y1之间的差值的绝对值,对差值绝对值最小的流域将其流域特征x1的秩记为对差值绝对值第二小的流域cτ,将其流域特征x1的秩记为r(cτ,x1)=2,以此类推,直到所有流域的流域特征x1的秩计算完毕;
15、同时,对其他六个流域特征x2到x7及y2到y7做同样处理,直到所有流域的所有流域属性的秩计算完毕,得到秩矩阵r,r矩阵第m行第n列的数据为(cm,xn);
16、步骤4.2,将秩矩阵r与步骤3所得特征权重向量w的转置相乘,得到带有流域特征权重的秩累计矩阵rw;
17、步骤4.3、选取秩累计矩阵rw中最小元素所在位置对应的流域ci,将流域ci的最优参数组直接移用至无资料流域uc,运行水文模型m(.)得到流域uc的出口流量。
18、进一步地,所述步骤1的详细方法为:
19、首先,对于流域[c1,c2,c3,…,ck],分别获取各个流域对应的水文气象数据集(包括降雨、蒸发和流量)记为[u1,u2,u3,…uk];并选择任意一个水文模型m(.),标记其待估参数,所有待估参数组成待估参数组par=[p1,p2,p3,…pp],并将非待估参数设置为默认值;
20、然后,对于流域c1,将其对应水文气象数据u1和待估参数组par1输入水文模型m(.),构建流域c1的水文模型m(u1,par1),并以最大化纳什效率系数为目标函数,使用洗牌复形演化算法sce-ua对水文模型m(u1,par1)的待估参数进行自动率定,得到流域c1的最优参数组
21、遍历流域[c1,c2,c3,…,ck],直至得到步骤1.1中全部流域的最优参数组
22、进一步地,所述步骤2的详细过程为:
23、首先,对于流域c1,基于流域数字高程地图来提取流域c1的下述特征值:流域面积x1、流域平均高程x2、河道平均坡度x3、面积坡度x4、河网密度x5;基于流域土地利用及覆被地图来提取流域c1的林地面积比x6;基于流域土壤分布图来提取流域c1的流域平均饱和渗透系数x7;
24、遍历流域[c1,c2,c3,…,ck],提取其他剩下流域的上述七个流域特征;
25、同样的方法提取待测无水文气象资料流域u c的七个特征,分别记为流域面积y1、流域平均高程y2、河道平均坡度y3、面积坡度y4、河网密度y5、林地面积比y6、流域平均饱和渗透系数y7。
26、进一步地,所述步骤3.2中特征向量和影子向量基于不纯度的特征重要性分数δi(xi)的计算公式如下:
27、
28、上式中,xi表示全部流域得到特征向量或影子向量,δit(xi)表示xi在随机森林的第t颗树的特征重要性分数,t表示随机森林总的树木数量,sj表示xi被用于分割的所有节点集合,i(s)是节点s的基尼指数;sl和sr分别是节点s的左子节点和右子节点,pl和pr分别是左子节点和右子节点的权重(节点样本数占比);δi(xi)为随机森林全部树的重要性分数的算数平均值;
29、所述步骤3.5中按对当前待估参数是否important分情况计算流域特征特征权重ω,具体计算公式如下:
30、
31、式中,ω(xi)为第i个流域特征的权重,δi_med(xi)为第i个流域特征的特征重要性分数的中值,δi_med(xz)为第z个被标记为important的流域特征重要性分数的中值,z为被标记为important的流域特征的数量;
32、所述步骤3.6中流域特征xi的最终权重w(xi)的计算公式为:
33、
34、式中,p为待估参数的数量,所有特征权重组成特征权重向量w=[w(x1),w(x2),…,w(x7)]。
35、有益效果:本发明在考虑流域属性相似性的基础上还考虑了流域特征的权重,将水文气象资料丰富流域的参数率定结果移用至无资料流域,在保证计算结果客观性与可靠性的基础上,解决了无资料流域水文模型参数率定困难的难题。且本方法主要应用流域数字高程模型、土壤地图、土地利用及植被覆盖等遥感观测数据,数据来源稳定可靠,方法中变量间的函数关系明确,有利于无资料流域水文模型参数估算的计算机自动化执行,保证结果的客观合理性,有利于无资料地区数字水文学研究的深入发展。
1.一种自动识别流域特征权重的水文模型参数区域化方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的自动识别流域特征权重的水文模型参数区域化方法,其特征在于,所述步骤1的详细方法为:
3.根据权利要求1所述的自动识别流域特征权重的水文模型参数区域化方法,其特征在于,所述步骤2的详细过程为:
4.根据权利要求1所述的自动识别流域特征权重的水文模型参数区域化方法,其特征在于,所述步骤3.2中特征向量和影子向量基于不纯度的特征重要性分数δi(xi)的计算公式如下: