环境科学研究  2019, Vol. 32 Issue (8): 1365-1373  DOI: 10.13198/j.issn.1001-6929.2018.11.16

引用本文  

高凤杰, 吴啸, 师华定, 等. 基于贝叶斯最大熵的黑土区小流域土壤有机质空间分布预测[J]. 环境科学研究, 2019, 32(8): 1365-1373.
GAO Fengjie, WU Xiao, SHI Huading, et al. Prediction of Spatial Distribution of Soil Organic Matter in a Mollisol Watershed of China based on BME Method[J]. Research of Environmental Sciences, 2019, 32(8): 1365-1373.

基金项目

国家重点研发计划项目(No.2016YFD0201009);国家自然科学基金项目(No.31700407)
National Key Research and Development Program of China (No.2016YFD0201009); National Natural Science Foundation of China (No.31700407)

责任作者

师华定(1979-), 男, 山西临汾人, 研究员, 博士, 主要从事气候变化和大气环境、气候变化风险评估、温室气体核算与管理、低碳经济研究, shihd@craes.org.cn.

作者简介

高凤杰(1981-), 女, 河北唐山人, 副教授, 博士, 主要从事资源环境遥感研究, gaojiecumt@126.com

文章历史

收稿日期:2018-06-11
修订日期:2018-11-05
基于贝叶斯最大熵的黑土区小流域土壤有机质空间分布预测
高凤杰1 , 吴啸1 , 师华定2 , 鞠铁男1 , 王鑫1 , 高东晶1 , 刘媚媚1     
1. 东北农业大学资源与环境学院, 黑龙江 哈尔滨 150030;
2. 中国环境科学研究院土壤与固体废物环境研究所, 北京 100012
摘要:进行w(SOM)空间预测研究,对掌握区域w(SOM)空间分布现状、实施精准农业以及保护区域生态环境都有着重要意义.以土地利用类型为辅助变量,将不同土地利用类型所对应w(SOM)的概率分布作为“软数据”,采用BME(贝叶斯最大熵)方法对我国东北黑土丘陵区海沟河小流域表层w(SOM)的分布情况进行空间预测,并与以w(TN)和土地利用类型为辅助变量的CK(协同克里格)方法进行比较,探讨两种方法的可行性与精度.结果表明:我国东北黑土丘陵区海沟河小流域表层w(SOM)平均值为24.04 g/kg,空间变异程度为中等.w(SOM)与w(TN)呈极显著正相关,与土地利用类型存在较强的相关性,不同土地利用类型w(SOM)差异明显,w(TN)与土地利用类型能够用来辅助w(SOM)的空间分布插值.相较于CK方法,BME方法能更好地利用“软数据”进行空间插值,使对w(SOM)预测结果的平均误差(ME)、平均绝对误差(MAE)和均方根误差(RMSE)均有所降低,精度大幅提高,空间插值效果明显优于CK方法.研究显示,研究区w(SOM)以阶梯状自东向西依次递减分布,在南北方向上变化不大,空间变化特征较为明显,BME方法利用“软数据”插值后的结果能较好地反映研究区w(SOM)空间分布的实际情况.
关键词土壤有机质    软数据    协同克里格    贝叶斯最大熵    空间预测    
Prediction of Spatial Distribution of Soil Organic Matter in a Mollisol Watershed of China based on BME Method
GAO Fengjie1 , WU Xiao1 , SHI Huading2 , JU Tienan1 , WANG Xin1 , GAO Dongjing1 , LIU Meimei1     
1. College of Resource and Environment, Northeast Agricultural University, Harbin 150030, China;
2. Institute of Soil and Solid Waste, Chinese Research Academy of Environmental Sciences, Beijing 100012, China
Abstract: The research of spatial prediction of soil organic matter (SOM) is of great important for mastering the current situation of spatial distribution of SOM content, implementing precision agriculture and protecting the regional ecological environment. With land use types as the auxiliary variable, the probability distribution of different land use types corresponding to SOM content was used as 'soft data', predicting the spatial distribution of SOM content in the surface soil of Haigouhe Watershed by using the Bayesian maximum entropy (BME) method, and compared with the co-Kriging (CK) which used soil total nitrogen and land use type as a supplementary variable, then discussed feasibility and precision of the two methods. The results show that the mean SOM content was 24.04 g/kg for the whole watershed with a degree of variation at a moderate level. SOM content was significantly positively correlated with total nitrogen, and had a strong correlation with land use types, the SOM content of different land use types was obviously different. Total nitrogen and land use types could be used to assist the spatial distribution interpolation of SOM content. Compared with the CK method, the BME method could make good use of 'soft data' for spatial interpolation, so that the mean error (ME), mean absolute error (MAE) and mean square root error (RMSE) of the prediction results of SOM content were reduced, the accuracy was greatly improved, and the spatial interpolation effect was obviously better than CK method. The research shows that the SOM content in the study area decreases stepwise from east to west, the content of north and south direction changed little, and the spatial variation characteristics were obvious. The results of BME interpolation using 'soft data' can better reflect the actual situation of the spatial distribution of SOM content in the study area.
Keywords: soil organic matter    soft data    Bayesian maximum entropy    cooperative Kriging    spatial prediction    

SOM(soil organic matter, 土壤有机质)是指以多种形式和状态存在于土壤中含碳有机物质的总称,是土壤的重要组成成分,与土壤环境质量、土壤肥力、作物生长以及区域生态环境质量等密切相关,尽管它只占土壤总量很小的一部分,但由于其参与土壤圈、生物圈甚至大气圈的物质能量循环而受到学术界广泛关注[1-3].我国东北黑土区土壤肥沃,是重要的商品粮基地,国内已有学者对黑土区w(SOM)空间分布进行了深入研究,发现黑土区在高产粮食的同时,也被过度开发垦殖,SOM流失问题严重,土壤肥力逐年下降[4-5],进行黑土区黑土资源的保护已刻不容缓.进行w(SOM)空间预测研究,对掌握区域w(SOM)空间分布现状、指导农业生产以及有效调控与提升黑土区土壤肥力都有着重要的意义[6-7].当前利用BME(Bayesian maximum entropy,贝叶斯最大熵)方法对小流域w(SOM)分布进行空间预测的研究比较少,并且对土壤属性的空间预测大多以普通克里格、协同克里格和回归克里格等经典地统计学空间插值方法为主[3, 8-9].其中,普通克里格方法是建立在空间自相关的基础上,在环境气象要素、土壤相关属性的空间预测中有着广泛应用,传统地统计学插值方法认为用于插值分析的数据皆是具体的数值型数据,未考虑其他辅助变量信息[10-11].协同克里格方法可以建立辅助变量和目标变量的交叉半变异函数关系,以此为基础来进行插值[12].回归克里格法则要求辅助变量为栅格或面状的连续型变量,以辅助环境变量和目标变量之间的回归关系进行插值分析[13].上述地统计插值方法在一定程度上可以提高空间插值精度,但是其插值结果与数据的分布均匀性以及数据量的大小有很大关系,且数据一般要求满足正态分布,虽然协同克里格方法和回归克里格法均可以利用辅助变量,但却忽视了那些不以数值数据表示的分类类别信息,如土壤质地类型[13]、土地利用类型、土壤类型[14-17]、植被类型、地物类型、时间序列信息等[18].高精度曲面建模(HASM)是近年发展起来的可用于地理信息系统和生态建模的一种较高精度的曲面建模方法,在提高了求解速度的前提下,保证了土壤属性的插值精度,将土壤属性的高精度曲面建模向实用性方面向前推进了一步,但其在利用辅助信息方面仍存在不足[19-21].

BME方法是一种非线性估计方法,它将最大熵法和贝叶斯模型各自的优点结合了起来,不仅能对确定性的“硬数据”进行空间插值,而且还能将一定的辅助信息转换为“软数据”(如数值间隔、概率密度函数、物理定律等)并进行空间预测[13, 18].经过多年的发展,BME方法已在测绘[22]、土壤环境[20, 23]、气候气象[18, 24]等诸多领域得以应用和发展. BME方法不但灵活地使用“软数据”提高了空间预测精度,而且大幅降低了数据的获取难度与成本,并且克服了传统的地统计学方法认为可以利用的数据皆是没有误差的确定性数据这一缺陷,从而为土壤属性的空间预测提供了新的思路和方法.

该研究将土地利用类型作为辅助变量,以不同土地利用类型所对应w(SOM)的概率分布作为“软数据”参与到BME方法的空间插值过程中,并与传统的地统计插值方法进行对比,旨在充分利用辅助信息以及提高土壤属性空间预测精度.

1 材料与方法 1.1 研究区概况

海沟河小流域(126°55′45″E~127°10′05″E、45°34′18″N~45°40′50″N)位于黑龙江省哈尔滨市阿城区,处于松嫩平原边缘,黑龙江省黑土带底端,总面积119.76 km2,行政隶属以料甸满族乡为主,包括红星乡的部分村屯.海沟河是松花江支流阿什河的最大支流,源于大顶子山山麓,流经红星乡、料甸满族乡后注入阿什河继而汇入松花江,全长68 km.流域东部地势较高,为山地丘陵,以林地为主要景观类型,西部地势较低,为平原耕作区,农业开发历史悠久,海拔54~366 m,海沟河小流域是比较有代表性的黑土区,其分布的土壤类型多为黑土.冬季时间漫长且寒冷干燥,夏季气候湿润且炎热多雨,多年平均气温3.9 ℃,年均降水量大于600 mm,且降水多发生在4—10月,占全年降水量的90%,属于典型的中温带大陆性季风气候.该流域距离哈尔滨市约30 km,受大城市快速发展的辐射作用影响,流域内交通发达,社会经济发展较为迅速,城市化进程较快,流域内土壤污染、水体污染、土地退化等生态环境问题也不断凸显.

1.2 数据来源与处理

基础地理数据:研究区土地利用类型数据采用的是Google Earth高分辨率SPOT影像(空间分辨率6 m,拍摄日期为2014年9月6日).选取合适的地面控制点进行几何校正、配准,在室内利用ArcGIS 10.0软件进行目视解译,得到研究区2014年土地利用类型数据(见图 1),通过手持GPS野外定点验证,影像判读的正确率在95%以上,满足研究对精度的需求.地形数据主要从中国科学院计算机网络信息中心(http://www.cnic.cas.cn)提供的30 m×30 m的DEM数据中获取(见图 1).

图 1 研究区土地利用现状与DEM分布 Fig.1 Land use state and distribution of DEM in study area

土壤采样:将研究区地形图、土地利用类型数据作为辅助信息,综合考虑地形、土地利用类型以及所布采样点与周边交通干道、居民点、主要水系的距离等要素,在室内进行网格布点.由于农作物生长以及当地农民的耕作措施都会对w(SOM)产生影响,因此待农作物收获后,于2014年10月正式开始野外定点采样工作,选择的120个采样点主要分布于研究区西部耕地区(见图 2).采样过程中,通过手持GPS进行空间定位,尽可能与室内预布点一致.每个采样点采用“五点取样法”采集土壤表层(0~20 cm)耕层土壤,将5个采样点的土壤样品混合均匀,取混合样品1 kg,留足试验用量,取样的同时记录好各采样点周边的环境信息和土地利用状况.

图 2 海沟河小流域采样点分布 Fig.2 Distribution of samples in the Haigouhe Watershed

实验室处理:采样工作结束后,将采集的120份土壤样品放置在风干室自然晾干,用木棒压碎挑拣出样品中碎石草根等杂物后研磨过筛.采用重铬酸钾容量法测定样品中w(SOM)[25];此外,也测定了w(TN)、w(TK)、w(TP)等指标,相关测试方法见《土壤和固体废弃物监测分析技术》.

1.3 研究方法 1.3.1 协同克里格方法

CK(cooperative Kriging,协同克里格)方法与普通克里格方法的原理大致相同,它是普通克里格方法的一种扩展延伸,在进行空间插值时,不仅考虑了区域化单一变量,还考虑了不同变量之间的交叉相关性,即在分析变量自身空间关系的同时,还考虑到不同变量间的相互关系[16, 18].因此,CK方法插值的结果由于利用协同区域化理论在主变量中加入其他相关变量的信息而得到显著改善,使其空间预测的精度大幅提高.其表达式为

$ {{Z_0} = \sum\limits_{i = 1}^{{d_1}} {{\lambda _i}} {Z_i} + \sum\limits_{j = 1}^{{d_2}} {{\lambda _j}} {Z_j}} $ (1)

式中:Z0为待估点的属性值,Zi为主变量在实测点i处的属性值,Zj为辅助变量在实测点j处的属性值,以上所述属性值在该研究中均指w(SOM);d1d2分别为主变量和辅助变量的采样点数量;λiλj分别为主变量和辅助变量的权重值.

土壤不同属性之间有着较强的空间相关性,当某两个或者几个属性的相关系数达到一定值时,表明它们在统计意义和空间位置上皆具有某种程度的相关性,称之为协同区域化[26-27],可利用CK方法来处理这种协同区域化变量.该研究在SPSS 18.0平台上对w(SOM)与各属性之间的相关性进行分析,然后通过ArcGIS 10.2的地统计模块实现CK方法的空间插值.

1.3.2 基于BME方法的w(SOM)空间预测 1.3.2.1 BME方法介绍和关键步骤

BME方法是基于时空随机场理论的空间预测新方法[28-29].在土壤属性的空间预测方面,传统的地统计方法认为可以利用的数据是一些实测的没有误差的数据(即“硬数据”),而忽视了一些没有直接相关的具有不确定性的数据(即“软数据”),“软数据”可以是粗测数据、历史数据、模型拟合数据,也可以是专家的经验知识或者已有的研究成果[18, 30-32]. BME方法能充分利用这些不确定性的数据,同时对“软数据”和“硬数据”进行空间插值,大幅提高了时空预测精度[33-35]. BME方法的基本原理如图 3所示,具体而言,假如已知a个“硬数据”和b个“软数据”,“硬数据”表示为xh=(x1, x2, …, xa),“软数据”表示为xs=(xa+1, xa+2, …, xb),通过BME方法预测待估点的数据,首先需计算出待估点的后验概率,对其进行模拟估计后再求算出后验概率密度函数,将其平均值或最大值作为待估点的数值.预测的后验概率表达式为

图 3 BME理论框架的一般流程 Fig.3 Flow chart of Baycsian maximum entropy method
$ f\left( {{x_j}|{x_1}, {x_2}, \cdots , {x_b}} \right) = \frac{{f\left( {{x_1}, {x_2}, \cdots , {x_b}, {x_j}} \right)}}{{f\left( {{x_1}, {x_2}, \cdots , {x_b}} \right)}} $ (2)
$ {{\bar x}_{j/J}} = \int {{x_j}} {f_j}\left( {{x_j}} \right){\rm{d}}{x_j} $ (3)
$ {{\bar x}_{j/J}} = \max \left[ {{f_j}\left( {{x_j}} \right)} \right] $ (4)

式中,xj为待估点的数值,J为广义知识和特定知识构成的知识库,fJ为基于J的后验概率密度函数.

从式(2)可以看出,对联合概率密度函数f(x1, x2, …, xb, xj)进行求解才能得到待估变量的后验概率.因此,BME方法包括3个关键步骤.

第1步是先验阶段.通过满足有限数据、平均值、期望值、协方差等统计矩构成广义知识库(GK),在预测随机变量的概率分布时,选择其中熵最大的概率分布(最大熵原理)作为先验概率密度函数.其表达式为

$ {f_{\rm{G}}}\left( {{x_{{\rm{map}}}}} \right) = {C^{ - 1}}\exp \left[ {\sum\limits_{\alpha = 1}^{{N_C}} {{\mu _\alpha }} {g_\alpha }\left( {{x_{{\rm{map}}}}} \right)} \right] $ (5)

式中:fG(xmap)为随机变量的先验概率密度函数; xmap为随机变量; gα为随机变量之间相互关系的已知函数; μα为拉格朗日乘子; NC为约束条件的总个数; C为起正则化约束作用的常数; α在此仅代表约束条件的编号,实际计算中与其取值无关.

第2步是中间阶段.综合实测数据(“硬数据”)和以其他形式表示的“软数据”构成特定知识库(SK).

第3步是后验阶段.将第1步得到的先验概率密度函数与第2步的特定知识库(SK)经过条件贝叶斯化后求解出后验概率密度函数,最后依式(3)(4)求得变量的平均值或最大值作为待估点的数值.

1.3.2.2 BME方法中软数据的获取

该研究中的“软数据”是通过土地利用类型数据获取的,即利用土地利用类型信息与w(SOM)之间的定量关系生成相应“软数据”,具体分4个步骤实现.

第1步:将研究区所测得的w(SOM)(记为S)的范围记为[Smin, Smax],根据研究所需的精度要求将此值域范围等分为m个组别,组别数可以在6~12之间进行选取,则第k组代表w(SOM)类别(记为Sk)的值域范围可表示为

$ S_{k}=\left[S_{\min }+\frac{S_{\max }-S_{\min }}{m} \times(k-1), S_{\min }+\frac{S_{\max }-S_{\min }}{m} \times k\right] $ (6)

第2步:每个w(SOM)类别与采样点的w(SOM)及土地利用类型数据(记为LX)是相互对应关系,为了定量表示w(SOM)类别和LX的模糊隶属度之间的关系,可以计算w(SOM)类别对于LX的模糊隶属度.记LX类别数为MLX,扫描并统计每个w(SOM)类别所对应采样点位置上LX值所属的LX类别数,则w(SOM)与土地利用类型定量关系可表示为

$ \begin{aligned} R_{\left(S_{k}, \mathrm{LX}\right)}=&\left[\left(\mathrm{LX}_{1}, \frac{C(1)_{k}}{C_{k}}\right), \left(L X_{2}, \frac{C(2)_{k}}{C_{k}}\right)\right.\\ & \cdots, \left(\mathrm{LX}_{\mathrm{MLX}}, \frac{C(\mathrm{MLX})_{k}}{C_{k}}\right) ] \end{aligned} $ (7)

式中:C(MLX)kSk所对应采样点位置上LX值所属的LX第MLX类别的采样点个数,CkSk中包含的采样点个数.式(7)结果可利用直方图的形式来表现w(SOM)类别对应采样点上土地利用类型取值的概率分布,即w(SOM)类别对于LX的模糊隶属度.

第3步:令栅格单元grid[x, y],根据Sk和LX的定量关系以及栅格单元上的LX数据(LXxy),求取基于LX数据值在Sk和LX定量关系上的土壤属性取值概率(Pk),所得值表示栅格单元内w(SOM)预测值对w(SOM)的第k组的相似度为

$ {P^k} = {R_{\left( {{S_k}, {\rm{LX}}} \right)}}{\rm{L}}{{\rm{X}}_{xy}}\quad \;\;\;(1 \le k \le m) $ (8)

第4步:计算栅格单元上的w(SOM)预测值对w(SOM)的每个含量类别的相似度,将其归一化后得出w(SOM)的模糊分布表达式为

$ \begin{aligned} f_{s}=\left[\left(S_{1}, P^{1}\right), \right.&\left(S_{2}, P^{2}\right), \cdots, \left(S_{k}, P^{k}\right) ] \\(1 \leqslant k \leqslant m) & \end{aligned} $ (9)

可以将上述模糊分布结果作为“软数据”,它反映的是某种土地利用类型和所对应的土壤中w(SOM)的概率分布.

1.4 预测结果精度评价

采用独立验证方法对CK和BME方法的空间插值结果进行验证,使用平均误差(ME)、平均绝对误差(MAE)以及均方根误差(RMSE)表示插值精度,计算公式:

$ {\rm{ME}} = \frac{1}{n}\sum\limits_{i = 1}^n {\left( {{{\hat Z}_i} - {Z_i}} \right)} $ (10)
$ {\rm{MAE}} = \frac{1}{n}\sum\limits_{i = 1}^n {\left| {{{\hat Z}_i} - {Z_i}} \right|} $ (11)
$ {\rm{RMSE}} = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{\left( {{{\hat Z}_i} - {Z_i}} \right)}^2}} } $ (12)

式中,${{{\hat Z}_i}}$为第i个采样点w(SOM)的预测值,Zi为第i个采样点w(SOM)的实际观测值,n为样点个数.平均误差、平均绝对误差以及均方根误差的值越小,说明误差越小,模拟精度越高.

通过ArcGIS 10.2数据管理工具中的创建随机点功能从120个采样点w(SOM)数据中抽取90个作为训练样本集,剩余的30个作为插值模拟结果的验证样本集.其中,验证样本集不参与插值模拟过程,只参与所得结果的验证过程.

2 结果与分析 2.1 w(SOM)描述性统计特征

研究区旱地、水田、林地和居民点用地4种不同土地利用类型的w(SOM)描述性统计特征如表 1所示.由表 1可见,研究区w(SOM)为6.30~57.30 g/kg,平均值为24.04 g/kg.在这4种不同土地利用类型中,水田w(SOM)的平均值(26.41 g/kg)最高,林地w(SOM)的平均值(32.00 g/kg)最低.通常认为[3],变异系数≤0.1时为弱变异程度,(0.1, 1)时为中等变异程度,≥1时为强变异程度.研究区全部采样点w(SOM)的变异系数为44.80%,属于中等变异程度,其中,居民点用地w(SOM)的变异系数最高,林地的最低,但都属于中等变异程度,由于居民点用地w(SOM)的变异系数较大,采样点较少,故不参与后续计算和插值分析.对研究区全部采样点w(SOM)进行K-S检验,P为0.121(大于0.05),结果表明原始数据符合正态分布,适合选用CK和BME方法进行建模插值分析.

表 1 不同土地利用类型的w(SOM)描述性统计特征值 Table 1 Descriptive statistical characteristic value of soil organic matter contents of different land use types
2.2 辅助变量的选取和利用 2.2.1 土壤属性

在选用CK方法对研究区w(SOM)空间分布进行预测时,要选用与w(SOM)相关性较高的变量作为辅助变量,w(SOM)与其他土壤属性进行相关性分析的结果如表 2所示.由表 2可见,研究区w(SOM)与w(TN)呈显著正相关,相关性系数为0.573,故用CK方法对研究区SOM进行空间预测时,主要选用与w(SOM)相关性最高的w(TN)作为辅助变量,在ArcGIS 10.2的地统计模块实现CK方法的空间插值.

表 2 土壤属性相关分析 Table 2 Correlation analysis among soil properties
2.2.2 土地利用类型

土地利用类型可能对土壤属性的空间分布产生一定影响,该研究采用方差分析法定量分析不同土地利用类型下w(SOM)的差别是否显著.通过Levene方法得到不同土地利用类型下w(SOM)的方差齐次性显著性P值为0.221(大于0.05),不存在方差不齐的现象,因此选用Student-Newman-Keuls多重比较方法比较不同土地利用类型下w(SOM)的差异性(见表 3).从表 3可以看出,不同土地利用类型下w(SOM)也有差别,表现为水田>旱地>林地,且这3种土地利用类型中w(SOM)存在显著差异.该研究在用CK和BME方法对w(SOM)进行空间预测时,选用的辅助变量是土地利用类型,故在进行插值前需要利用单因素方差分析来判断土地利用类型与w(SOM)之间是否存在一定的相关性.将研究区120个采样点的w(SOM)按3种土地利用类型分为3组,组别作为因子,w(SOM)作为因变量来进行单因素方差分析,分析结果如表 4所示.从表 4可以看出,不同土地利用类型与w(SOM)之间呈显著差异,相关性较强(P<0.05),这与其他学者[13, 36]的判断一致.由于土地利用类型无法直接参与CK插值,故将采样点分布和土地利用类型数据进行叠加,计算同一土地利用类型斑块内所有采样点的w(SOM)平均值,并生成格网大小为100 m的不同土地利用类型的w(SOM)平均值栅格数据作为CK方法的辅助变量. BME方法能利用SEKS-GUI(spatiotemporal epistematics knowledge synthesis and graphical user interface)软件同时处理土地利用类型和w(SOM)数据,实现对研究区w(SOM)的空间分布预测,具体算法见文献[16].

表 3 不同土地利用类型下w(SOM)的多重比较 Table 3 Multiple comparison of OM content of different land use types

表 4 w(SOM)与土地利用类型的单因素方差分析 Table 4 One-way ANOVA of soil organic matter and land use types
2.3 w(SOM)的空间分布

CK和BME方法得到的w(SOM)空间分布如图 4所示.由图 4可见,CK和BME方法所得研究区w(SOM)的空间分布趋势大致相同,且皆为阶梯状自东向西依次递减分布,低值区出现在东部低山丘陵区,高值区出现在西部平原耕作区,空间变化特征较为明显;但在南北方向上w(SOM)变化差别不大,这可能与研究区流域内南北方向地形变化不明显有关.

图 4 海沟河小流域w(SOM)空间分布 Fig.4 Spatial distribution of SOM in the Haigouhe Watershed

在图斑形状上,CK和BME方法所得结果有较大不同:CK方法所得的w(SOM)结果的图斑集中成片,平滑效应比较明显,值域范围较窄,且与实测值之间存在较大差异;而BME方法所得w(SOM)结果的图斑离散度较高,弱化了传统克里格方法所带来的平滑效应,预测结果数据更接近于实测值范围.因此,以土地利用类型为辅助变量的BME方法空间插值效果明显优于CK方法.

2.4 精度比较

根据预留验证点,比较两种方法对w(SOM)的空间预测精度,从表 5可以看出,以土地利用类型为辅助变量的BME方法,其平均误差、平均绝对误差和均方根误差分别为3.22、3.86、4.01,均低于以w(TN)和土地利用类型为辅助变量的CK方法.因此,笔者认为BME方法在辅助信息利用效率和预测精度等方面都优于CK方法,在指导农业生产管理、有效调控与提升土壤肥力、保护区域生态环境等方面具有更好的指导意义.

表 5 不同插值方法下w(SOM)空间预测精度比较 Table 5 Comparison of spatial prediction accuracy of SOM in different interpolation methods
3 讨论

对区域w(SOM)的空间分布进行精准预测在指导农业生产、合理施肥、控制水土流失以及有效调控与提升土壤肥力等方面都有着重要的意义.该研究将土地利用类型这一范畴型变量转化为“软数据”,是一次很好的实践,也有学者将土壤质地类型作为辅助变量参与到BME方法的空间预测中[13],成功证明了BME方法比传统地统计法更能反映出研究区w(SOM)的实际分布情况,且精度较高,说明利用更多类型的环境类数据计算“软数据”并应用到BME方法中是合理可行的[37-41].

笔者将某种土地利用类型和所对应w(SOM)的概率分布作为软数据成功预测了研究区w(SOM)的空间分布,但在其计算方式上有待进一步规范和改善,后期可以利用多种辅助信息融入“软数据”的计算过程中,并引入不同属性含量类别与环境要素的决定系数、相似度等进行归一化处理,作为权重,来获取结合了多种辅助信息的“软数据”.实际上,土壤养分含量分布还受人类活动、耕作措施、气候等因素的影响,因此今后应将这些因素纳入BME方法研究工作中.流域是基于自然因素形成的集自然、社会经济过程于一体的复杂系统,对其区域土壤属性进行空间预测时,应充分考虑其成土母质、地形地貌、交通、居民点分布等因素的影响.该研究仅将土地利用类型这一种信息作为辅助变量,对其他辅助信息考虑较少,今后研究中应将更多种类辅助信息结合起来进行BME方法的空间预测,以期满足更高的精度要求.

4 结论

a) 研究区w(SOM)范围为6.30~57.30 g/kg,平均值为24.04 g/kg,全部采样点w(SOM)的变异系数为44.80%,均属于中等变异程度.

b) w(SOM)与w(TN)、土地利用类型之间均存在较强的相关性,故用CK方法进行插值时选用土壤w(TN)和土地利用类型作为辅助变量,用BME方法进行插值时选用土地利用类型作为辅助变量.

c) CK方法和BME方法对w(SOM)都有较好的估值精度,其中BME方法得到w(SOM)的平均误差、平均绝对误差和均方根误差分别为3.22、3.86和4.01,低于CK方法所得结果,因此认为BME方法在充分利用辅助信息和空间预测等方面优于CK方法.

参考文献
[1]
VANDENBYGAART A J, GREGORICH E G, ANGER D A. Influence of agricultural management on soil organic carbon:a compendium and assessment of Canadian studies[J]. Canadian Journal of Soil Science, 2003, 83(4): 363-80. DOI:10.4141/S03-009 (0)
[2]
ELBERLING B, GREGOICH E G, HOPKINS D W, et al. Distribution and dynamics of organic matter in an Antarctic dry valley[J]. Soil Biology and Biochemistry, 2006, 38(10): 3095-3106. DOI:10.1016/j.soilbio.2005.12.011 (0)
[3]
马泉来, 高凤杰, 张志民, 等. 我国东北黑土丘陵区小流域土壤有机质空间分布模拟[J]. 环境科学研究, 2016, 29(3): 382-390.
MA Quanlai, GAO Fengjie, ZHANG Zhimin, et al. Simulation of spatial distribution of soil organic matter in a mollisol watershed in northeastern China[J]. Research of Environmental Sciences, 2016, 29(3): 382-390. (0)
[4]
汪景宽, 李双异, 张旭东, 等. 20年来东北典型黑土地区土壤肥力质量变化[J]. 中国生态农业学报, 2007, 15(1): 19-24.
WANG Jingkuan, LI Shuangyi, ZHANG Xudong, et al. Spatial and temporal variability of soil quality in typical black soil area in northeast China in 20 years[J]. Chinese Journal of Eco-Agriculture, 2007, 15(1): 19-24. (0)
[5]
韩秉进, 张旭东, 隋跃宇, 等. 东北黑土农田养分时空演变分析[J]. 土壤通报, 2007, 38(2): 238-241.
HAN Bingjin, ZHANG Xudong, SUI Yueyu, et al. Analysis for temporal and spatial changes of black soil cropland in the northeast area of China[J]. Chinese Journal of Soil Science, 2007, 38(2): 238-241. DOI:10.3321/j.issn:0564-3945.2007.02.007 (0)
[6]
STEVENS A, Van WESEMAEL B, BARTHOLOMEUS H, et al. Laboratory, field and airborne spectroscopy for monitoring organic carbon content in agricultural soils[J]. Geoderma, 2008, 144(1/2): 395-404. (0)
[7]
白雪, 王文杰, 王维, 等. 浙江省宁波市土壤有机质的时空变异特征[J]. 环境科学研究, 2010, 23(2): 191-197.
BAI Xue, WANG Wenjie, WANG Wei, et al. Spatio-temporal variability characteristics of soil organic matter in Ningbo City, Zhejiang Province[J]. Research of Environmental Sciences, 2010, 23(2): 191-197. (0)
[8]
SUMFIETH K, DUTTMANN R. Prediction of soil property distribution in paddy soil landscapes using terrain data and satellite information as indicators[J]. Ecological Indicators, 2008, 8(5): 485-501. DOI:10.1016/j.ecolind.2007.05.005 (0)
[9]
陆访仪, 赵永存, 黄标, 等. 海伦市耕层土壤有机质含量空间预测方法研究[J]. 土壤通报, 2012, 43(3): 662-667.
LU Fangyi, ZHAO Yongcun, HUANG Biao, et al. Comparison of predicting methods for mapping the spatial distribution of topsoil organic matter content in cropland of Hailun[J]. Chinese Journal of Soil Science, 2012, 43(3): 662-667. (0)
[10]
ALLARD D. Geostatistical classification and class Kriging[J]. Journal of Geographic Information and Decision Analysis, 1998, 2(2): 77-90. (0)
[11]
ISSAZADEH L, UMAR M I, HASSANPOUR J. Geostatistical analysis of the permeability coefficient in different soil textures[J]. Contemporary Agriculture, 2018, 67(2): 119-124. DOI:10.2478/contagri-2018-0017 (0)
[12]
李启权, 王昌全, 张文江, 等. 基于神经网络模型和地统计学方法的土壤养分空间分布预测[J]. 应用生态学报, 2013, 24(2): 459-466.
LI Qiquan, WANG Changquan, ZHANG Wenjiang, et al. Predictionof soil nutrients spatial distribution based on neuralnetwork model combined with goestatistics[J]. Chinese Journal of Applied Ecology, 2013, 24(2): 459-466. (0)
[13]
张若兮, 杨勇, 张楚天. 基于范畴型变量和贝叶斯最大熵的土壤有机质空间预测[J]. 土壤通报, 2015, 46(2): 312-318.
ZHANG Ruoxi, YANG Yong, ZHANG Chutian. Prediction of spatial distribution of soil organic matter based on categorization variables and BME methods[J]. Chinese Journal of Soil Science, 2015, 46(2): 312-318. (0)
[14]
BRUS D J, BOGAERT P, HEUVELINK C B M. Bayesian maximum entropy prediction of soil categories using a traditional soil map as soft information[J]. European Journal of Soil Science, 2007, 59(2): 166-177. (0)
[15]
DOUAIK A, VAN M M, TO T T. Soil salinity mapping using spatio-temporal Kriging and Bayesian maximum entropy with interval soft data[J]. Geoderma, 2005, 128(3): 234-248. (0)
[16]
李明阳, 张晓利, 刘方, 等. 基于贝叶斯最大熵模型的紫金山松材线虫危害程度时空分析[J]. 西北农林科技大学学报(自然科学版), 2012, 40(7): 99-105.
LI Mingyang, ZHANG Xiaoli, LIU Fang, et al. BME-based spatiotemporal analysis of damage to pine wood nematode Bursaphelenchus xylophilus in Zijin Mountain[J]. Journal of Northwest A & F University (Natural Science Edition), 2012, 40(7): 99-105. (0)
[17]
DOR D, BOGAERT P, CHRISTAKOS G. Application of the BME approach to soil texture mapping[J]. Stochastic Environmental Research and Risk Assessment, 2001, 15(1): 87-100. DOI:10.1007/s004770000057 (0)
[18]
李爱华, 柏延臣. 基于贝叶斯最大熵的甘肃省多年平均降水空间化研究[J]. 中国沙漠, 2012, 32(5): 1408-1416.
LI Aihua, BO Yanchen. Spatial interpolation of mean yearly precipitation in Gansu Province based on Bayesian maximum entropy[J]. Journal of Desert Research, 2012, 32(5): 1408-1416. (0)
[19]
SHI Wenjiao, YUE Tianxiang, LI Xuewen. Surface modeling of soil antibiotics[J]. Science of the Total Environment, 2016. DOI:10.1016/j.scitotenv.2015.11.077 (0)
[20]
LI Qiquan, WANG Changquan, DAI Tianfei, et al. Prediction of soil cadmium distribution across a typical area of Chengdu Plain, China[J]. Scientific Reports, 2017, 7(1): 7115. DOI:10.1038/s41598-017-07690-y (0)
[21]
SHI Wenjiao, LIU Jiyuan, DU Zhengping, et al. Development of a surface modeling method for mapping soil properties[J]. Journal of Geographical Sciences, 2012, 22(4): 752-760. DOI:10.1007/s11442-012-0960-z (0)
[22]
孙永厚, 周洪彪, 黄美发. 基于最大熵的测量不确定度的贝叶斯评估方法[J]. 统计与决策, 2008(12): 143-145.
SUN Yonghou, ZHOU Hongbiao, HUANG Meifa. Bayesian estimation method for uncertainty based on maximum entropy[J]. Statistics and Decision, 2008(12): 143-145. (0)
[23]
杨勇, 张若兮. 贝叶斯最大熵地统计方法研究与应用进展[J]. 土壤, 2014, 46(3): 402-406.
YANG Yong, ZHANG Ruoxi. Review on Bayesian maximum entropy geostatistics method[J]. Soils, 2014, 46(3): 402-406. (0)
[24]
邹松兵.基于GIS的甘肃中部地区气温降水分布模式研究[D].兰州: 兰州大学, 2002. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y450638 (0)
[25]
鲍士旦. 土壤农化分析[M]. 北京: 中国农业出版社, 2000. (0)
[26]
庞夙, 李廷轩, 王永东, 等. 县域农田土壤铜含量的协同克里格插值及采样数量优化[J]. 中国农业科学, 2009, 42(8): 2828-2836.
PANG Su, LI Yanxuan, WANG Yongdong, et al. Spatial interpolation and sampling numbers of the concentration of copper in cropland soil on county scale using co-Kriging[J]. Scientia Agricultura Sinica, 2009, 42(8): 2828-2836. DOI:10.3864/j.issn.0578-1752.2009.08.023 (0)
[27]
郭龙, 张海涛, 陈家赢, 等. 基于协同克里格插值和地理加权回归模型的土壤属性空间预测比较[J]. 土壤学报, 2012, 49(5): 1037-1042.
GUO Long, ZHANG Haitao, CHEN Jiaying, et al. Comparison between co-Kriging model and geographically weighted regression model in spatial prediction of soil attributes[J]. Acta Pedological Sinical, 2012, 49(5): 1037-1042. (0)
[28]
CHRISTAKOS G. Modern spatiotemporal geostatistics[M]. NewYork: Oxford University Presess, 2000: 71-130. (0)
[29]
CHRISTAKOS G. A Bayesian maximum-entropy view to the spatial estimation problem[J]. Mathematical Geology, 1990, 22(7): 763-777. DOI:10.1007/BF00890661 (0)
[30]
罗明, 裴韬. 空间软数据及其插值方法研究进展[J]. 地理科学进展, 2009, 28(5): 663-672.
LUO Ming, PEI Tao. Review on soft spatial data and its spatial interpolation methods[J]. Progress in Geography, 2009, 28(5): 663-672. (0)
[31]
王景雷, 康绍忠, 孙景生, 等. 基于贝叶斯最大熵和多源数据的作物需水量空间预测[J]. 农业工程学报, 2017, 33(9): 99-106.
WANG Jinglei, KANG Shaozhong, SUN Jingsheng, et al. Spatial prediction of crop water requirement based on Bayesian maximum entropy and multi-source data[J]. Transactions of the Chinese Society of Agricultural Engineering, 2017, 33(9): 99-106. (0)
[32]
高胜国, 翁海腾, 朱忠礼. 贝叶斯最大熵及其在地球科学领域的应用进展[J]. 江苏农业科学, 2017, 45(18): 11-16. (0)
[33]
江曲图, 何俊昱, 王占山, 等. 基于LUR/BME的海岸带地区PM2.5时空特性研究[J]. 中国环境科学, 2017, 37(2): 424-431.
JIANG Qutu, HE Junyu, WANG Zhanshan, et al. Spatiotemporal analysis of PM2.5 in large coastal domains by combining land use regression and Bayesian maximum entropy[J]. China Environmental Science, 2017, 37(2): 424-431. (0)
[34]
杨勇, 张楚天, 贺立源. 基于贝叶斯最大熵的多因子空间属性预测新方法[J]. 浙江大学学报(农业与生命科学版), 2013, 39(6): 636-644.
YANG Yong, ZHANG Chutian, HE Liyuan. New multifactor spatial prediction method based on Bayesian maximum entropy[J]. Journal of Zhejiang University (Agriculture and Life Science), 2013, 39(6): 636-644. (0)
[35]
史婷婷, 杨晓梅, 张涛, 等. 基于TRMM数据的福建省降水时空格局BME插值分析[J]. 地球信息科学学报, 2014, 16(3): 470-481.
SHI Tingting, YANG Xiaomei, ZHANG Tao, et al. Spatiotemporal analytical research of precipitation in Fujian Province based on TRMM and BME[J]. Journal of Geo-Information Science, 2014, 16(3): 470-481. (0)
[36]
蒋薇. 不同土地利用类型土壤有机质与全氮供应研究[J]. 绿色科技, 2014(5): 10-12.
JIANG Wei. Study on soil organic matter and total nitrogen supply in different land use types[J]. Journal of Green Science and Technology, 2014(5): 10-12. DOI:10.3969/j.issn.1674-9944.2014.05.004 (0)
[37]
D'OR D, BOGAERT P. A Spatial prediction of categorical variables with the Bayesian maximum entropy approach:the Ooyploder case study[J]. European Journal of Soil Science, 2004, 55(4): 763-775. DOI:10.1111/j.1365-2389.2004.00628.x (0)
[38]
LEE S, BALLING R, GOBER P. Bayesian maximum entropy maping and the soft data problem in urban climate research[J]. Geographers, Annals of the Association, 2008, 98(2): 309-322. DOI:10.1080/00045600701851184 (0)
[39]
XU Y, SERRE M L, REYES J M, et al. Impact of temporal upscaling and chemical transport model horizontal resolution on reducing ozone exposure misclassification[J]. Atmospheric Environment, 2017, 166(10): 374-382. (0)
[40]
PRAHLAD J, MARC L S. Bayesian maximum entropy space/time estimation of surface water chloride in Maryland using river distances[J]. Environmental Pollution, 2016, 219(9): 1148-1155. (0)
[41]
GAO Shengguo, ZHU Zhongli, LIU Shaomin, et al. Estimating the spatial distribution of soil moisture based on Bayesian maximum entropy method with auxiliary data from remote sensing[J]. International Journal of Applied Earth Observations and Geoinformation, 2014, 32(3): 54-66. (0)