摘 要:【目的】利用高光谱数据快速估算土壤有机碳含量,为干旱区湖滨绿洲合理开发土地资源提供科学依据。
【方法】以新疆博斯腾湖北岸湖滨绿洲为研究区,将实测的土壤有机碳含量数据与高光谱数据相结合,对原始光谱进行SG平滑(SavitzkyGolay smoothing,SG)、连续统去除(Continuum Removal,CR)、连续小波变换(Continuous Wavelet Transform,CWT)预处理,采用连续投影算法(Successive Projections Algorithm,SPA)筛选特征波段;应用支持向量机(Support Vector Machines,SVM)模型估算土壤有机碳含量。
【结果】(1)研究区土壤有机碳含量为0.69~50.32 g/kg,平均值为14.15 g/kg,标准差为9.51 g/kg,呈中等变异性,变异系数为67.20%。(2)土壤原始光谱反射率在350~750 nm,光谱反射率呈上升趋势,在750~2 150 nm,光谱反射率呈相对平稳趋势,在2 150~2 500 nm,光谱反射率逐渐下降;连续小波变换对土壤原始光谱预处理后随着分解尺度的增加,光谱局部特征明显,吸收峰和反射峰越来越平滑;采用连续投影算法筛选的光谱特征波段集中于350~952 nm、1 007~1 742 nm、2 082~2 381 nm,且特征波段仅占可见光-近红外光谱波段的0.30%。(3)连续小波变换结合连续投影算法构建的SVM模型,其训练集和验证集分别R2=0.76,RMSE=4.78和R2=0.94,RMSE=3.30,RPD=2.50。
【结论】CWT-SPA-SVM可有效估算研究区土壤有机碳含量。
关键词:土壤有机碳含量;连续小波变换;连续投影算法;支持向量机模型;高光谱数据
中图分类号:S151.9"nbsp; 文献标志码:A"" 文章编号:1001-4330(2024)06-1477-10
0 引 言
【研究意义】土壤有机碳(SOC)是陆地生态系统中重要的碳储集库,其含量是评价土壤质量的关键参数,对土地生产力具有重要影响,其控制着土壤环境中的各种物理、化学和生物过程[1-3]。因此,快速监测土壤有机碳含量,可以为合理开发土地资源提供科学依据。传统的土壤有机碳含量测定方法费力、昂贵[4]。采用可见-近红外波段的高光谱技术是一种快速、准确、经济、无损的土壤分析方法[5],对原始光谱降噪提高土壤有机碳含量的精度估算具有重要意义。【前人研究进展】已有研究采用SG平滑[6]、连续统去除[7]方法对高光谱数据去噪和增强光谱信号[8]。近些年连续小波变换被广泛用于土壤光谱研究中。玉米提·买明等[9]利用连续小波变换构建了土壤有机质含量的SVM模型,R2=0.84,RMSE=1.49,RPD=2.11。廖钦洪等[10]研究也表明,基于连续小波变换构建的土壤有机质含量的估算精度优于常用光谱变换方法。然而筛选具有典型的特征波段是构建估算模型的前提,许多研究采用相关系数法、竞争自适应重加权采样法、遗传算法、连续投影算法(SPA)等进行特征波段筛选。孟珊等[11]对原始光谱进行数学变换及微分变换后,利用竞争自适应重加权采样(CARS)构建了研究区土壤有机碳含量的BP神经网络模型,训练集和验证集R2分别为0.81、0.83,RPD分别为2.30、2.45,RMSE分别为5.75、4.89 g/kg。牛芳鹏等[12]对原始光谱进行SG平滑、标准化正态变换及一阶微分后,利用SPA构建了研究区土壤有机碳含量的SVM模型,其训练集与验证集R2分别为0.83和0.85,RMSE分别为5.59和3.16 g/kg,RPD为2.25。章海亮等[13]研究表明,SPA可以减少变量个数的冗余,其筛选出的变量个数比ACO算法和小波算法等方法筛选出的变量更少且提高建模的精度。PENG等[14]利用SPA算法简化了模型,产生了比全光谱更高的模型精度。叶红云等[15]研究发现,连续小波变换比传统光谱数学变换具有明显的稳定性。【本研究切入点】由于土壤光谱特征存在差异性,虽然前人使用传统的数学变换估算土壤有机碳含量,但效果有待提高;目前对于连续小波变换结合SPA算法构建的SVM模型的估算较少。需利用高光谱数据快速估算土壤有机碳含量。【拟解决的关键问题】以新疆博斯腾湖北岸湖滨绿洲为研究区,对采集的土壤高光谱数据采用SG平滑、连续统去除、连续小波变换降低高光谱噪声,凸显反射光谱特征,将预处理后的高光谱数据与土壤有机碳含量的实测数据相结合;采用SPA算法筛选出特征波段,应用支持向量机(SVM)构建博斯腾湖北岸湖滨绿洲土壤有机碳含量估算模型,分析土壤有机碳含量最佳小波分解尺度,为绿洲土壤有机碳含量的估算研究提供方法支撑。
1 材料与方法
1.1 材 料
新疆博斯腾湖北岸湖滨绿洲(41°45′~42°10′ N,86°15′~86°55′ E)隶属于新疆博湖县,地处焉耆盆地东南部,总面积1 360 km2。该区年均温8.0~8.6℃,夏季平均气温22.8℃,冬季平均气温9.0℃,无霜期176~200 d,年均降水量83.55 mm,年均蒸发量1 880~2 785.8 mm,土壤类型主要为潮土、草甸土、沼泽土等,土壤有机碳量平均值为13.31 g/kg[12, 16-17]。
土壤采样点位置按照“S”形状随机均匀设置16个,GPS定位。采样时间为2021年6月7~9日。分别采集0~10 cm、10~20 cm、20~30 cm、30~40 cm深度的土样,共计64个土壤样品;运用四分法选取(200±0.5) g土壤装袋带回实验室。通过自然风干和研磨,过60目的网筛,再将处理后的土壤重新封装。每个样本分为2份,其中1份用作测量土壤高光谱数据,另外1份用作测量土壤有机碳含量。
1.2 方 法
1.2.1 土壤光谱测量及预处理
采用ASD FieldSpec3便携式地物光谱仪(光谱范围350~2 500 nm)在野外采集。光谱数据在室外测量需选择晴朗无风天气,保证太阳为唯一光源,并且在测量时间内太阳光照稳定,采集时间为11:00~14:00。由于环境因素的影响,剔除土壤高光谱数据噪声比较大的尾部波段2 451~2 500 nm及剔除受水汽影响波段1 300~1 450 nm,1 800~1 950 nm[18],对土壤光谱曲线使用SG平滑(5个点窗口数,2次多项式)、连续统去除(CR)以及连续小波变换(CWT)对土壤反射高光谱数据进行变换处理。
1.2.1.1 SG平滑
SG平滑由Savizkg和Golag提出,是一种加权平均法,通过对原始土壤光谱反射率数据进行SG平滑,可以减少噪声的干扰及光谱曲线毛刺,提升高光谱数据信噪比,采用多项式计算中心波长点K处经SG平滑的平均值[19]。
式中,R′i与Ri为i点平滑前与平滑后的值;K为表窗口数;Wj为权重因子。
1.2.1.2 连续统去除
将光谱反射率的曲线值归一化至0~1,可以有效的反映土壤光谱的反射、吸收特征[19]。
式中,D为吸收带深度;Rb为波段中心的反射率;Rc表示与Rb波长相同的连续介质的反射率。
1.2.1.3 连续小波变换
选择bior1.3为小波变换基函数,在不同尺度下将土壤反射高光谱数据进行分解[19]。
式中,Wf(a,b)为2个维度的小波能量系数,即分解尺度(1,2…,m)和波段(1,2…,n);λ为350~2 450 nm波段;φa,b为小波基函数,其中a为尺度因子,b为平移因子;f(λ)为光谱反射率。
1.2.2 特征波段筛选
连续投影算法(SPA)属于前向选择方法,通过用少量的光谱信息来反映多数的光谱信息效果。能够有效地减少信息重叠,使变量之间的共线性达到最小,减少了建模变量的个数,有效提高建模的效率[20]。
起始波段和变量个数记作k(0)和N,J记作光谱矩阵。
(1)初始化n=1,xj∈Xj,j=1,…,J;
(2)确定未选波段变量
S=Xj≤i≤J,ik(0),…,k(N-1);
(3)计算未选波段和初始化波段的投影映射;
Pxj=xj-(xTjxi)xi(xTixi)-1,xi∈S;
(4)确定最大投影
k(n)=max(‖Pxj‖),xj∈S;
(5)xj=Pxj,j∈S;
(6)n=n+1,当n<N时,返回步骤2;
(7)确定选择波段序列k(n);n=0…,N-1。
1.2.3 估算模型构建及精度验证
支持向量机(SVM)是一种非线性机器学习模型,将非线性可分样本数据通过核函数映射到高维线性可分空间,之后用优化法求解超平面,确定决策函数参数,使其结构风险最小化[21]。以流程图的形式描述研究区土壤有机碳含量的高光谱估算流程:采用ASD FieldSpec3便携式地物光谱仪在自然光的条件下测量土壤光谱;将预处理后的土壤光谱数据通过SPA算法筛选特征波段;将特征波段与SOC含量实测数据相结合构建SOC含量的SVM估算模型;对模型的估算精度进行验证,其指标采用决定系数(R2)、均方根误差(RMSE)、相对分析误差(RPD)、1∶1线来评价其模型精度的有效性。R2值越向1接近,RMSE值越小,RPD越大,模型估算能力越有效。1∶1线表示实测值、估算值所构成的点偏离y=x线的程度[22]。支持向量机(SVM)采用The Unscrambler X构建土壤有机碳含量的估算模型。模型的训练集和验证集数据按照3∶1随机分配[23]。采用浓度梯度法依次每隔两个样本取一个作为验证集[24]。图1
2 结果与分析
2.1 土壤有机碳含量描述性统计
研究表明,验证集共计21个样本,训练集共计43个样本,训练集的平均值(3.47~50.32 g/kg)和验证集的平均值(0.69~36.65 g/kg)为14.09和14.27 g/kg,标准差分别为9.88和8.94 g/kg,变异系数分别为70.12%和62.64%;土壤有机碳含量总集的平均值为14.15 g/kg,标准差为9.51 g/kg,变异系数为67.20%,介于训练集与验证集之间,数据离散度不强。标准差和平均值都很接近,训练集和验证集与总集相比的统计分布相似,样本划分是合理的。表1
2.2 土壤有机碳含量的光谱特征
研究表明,土壤光谱反射率随着波长的增加发生变化,每个土壤样本的光谱反射率变化趋势比较相像,在350~750 nm,光谱反射率呈上升趋势,在750~2 150 nm,光谱反射率呈相对平稳趋势,从2 150 nm开始至2 500 nm,光谱反射率逐渐下降。土壤原始光谱在1 300~1 450 nm,1 800~1 950 nm波段范围内受水汽影响,以及在2 451~2 500 nm噪声比较大的尾部波段,特剔除以上波段。图2
土壤原始光谱反射经SG平滑预处理后,可以消除2 300~2 400 nm的毛刺。通过连续统去除后吸收峰更加明显,主要表现在375、495、720、760、940、1 125、1 450、1 800、1 950、2 215和2 335 nm。使用连续小波变换对光谱预处理后,其1~5尺度下波段500~1 750 nm的光谱信息比较微弱;6~10尺度下随着分解尺度的增加,光谱中的微小特征越来越明显,吸收峰和反射峰也越来越平滑。
土壤反射光谱经SG平滑、连续统去除、连续小波变换预处理后有效凸显土壤反射光谱特征,尤其是局部吸收特征比较明显。图3
2.3 采用SPA算法特征波段筛选
研究表明,光谱数据经连续小波变换处理后,采用SPA算法筛选特征波段,SPA算法筛选特征波段时将最大和最小特征变量的参数设为30和1,由于分解尺度的不同,其筛选出的特征波段数量和位置也不同。特征波段主要集中于350~952、1 007~1 742、2 082~2 381 nm,通过SPA算法筛选后的特征波段仅占可见光-近红外光谱波段的0.30%,减少了光谱中的冗余。图4
2.4 土壤有机碳含量建模及验证
研究表明,以连续小波变换(1、2、3、4、5、9、10尺度)预处理后的光谱数据作为自变量,通过连续投影算法筛选特征波段后构建的SVM模型,其2、4、5尺度训练集验证集R2均大于0.7,RPD均大于1.4,模型均具有有效的估算能力和稳健性;其中2尺度训练集和验证集的估算精度相对较高,稳健性较好,训练集和验证集分别R2=0.76,RMSE=4.78和R2=0.94,RMSE=3.30,RPD=2.50。表2
在2尺度下SVM模型的实测值和预测值基本分布在1∶1线附近,散点分布比较集中。综合分析,连续小波变换预处理后的光谱数据结合连续投影算法构建的SVM模型具有很好的估算能力,可以有效估算土壤有机碳含量。图5
3 讨 论
3.1
特征波段位置在可见光区金属离子电子跃迁和近红外区有机质和粘土矿物电子跃迁及土壤拉伸和弯曲振动[25]。CWT作为一种光谱信号处理方法,能够有效地对光谱数据去噪,并检测出有效光谱信号,挖掘隐藏信息,在土壤有机质高光谱估算中具有重要作用[26]。研究使用连续小波变换方法对光谱数据预处理后,光谱信息有效凸显局部细小吸收特征。与玉米提·买提等[9]利用连续小波变换估算土壤有机质含量的研究结果一致。LI等[27]研究表明利用连续小波变换(CWT)对多尺度下的土壤原始光谱预处理后提高了光谱响应程度。连续小波变换处理光谱数据的特征提取和降维具有明显的效果,随着分解尺度的增加,光谱中的吸收峰和反射峰也越来越平滑,与郭斌等[19]研究一致。研究可知连续投影算法在筛选特征波段时可以消除光谱信息的冗余度,随着连续小波变换的分解尺度不同,其特征波段的数量也会发生变化。模型精度的高低代表其估算的有效性。于雷等[22]利用连续小波变换构建的SVMR模型,R2和RMSE分别为0.83和4.02,RPD为2.48,与研究结果基本一致。
3.2
刘翠英等[28]研究表明针对土壤团聚体有机碳构建的SVM模型预测能力较差,其R2<0.66,RPD<2,与试验研究结果不同,可能是由于特征波段的筛选方法不同导致。所以特征波段的选择是提高估算模型精度的关键,连续投影算法在简化模型的同时提高模型精度,光谱数据经连续小波变换预处理后采用连续投影算法筛选的特征波段数量和位置因分解尺度的不同而变化。研究对连续小波变换处理后的光谱数据采用连续投影算法筛选特征波段,然后构建土壤有机碳含量的SVM估算模型。肖艳等[29]利用连续小波变换和连续投影算法构建了黑土有机质含量的SVM模型,证明了基于连续小波变换和连续投影算法建模的估测效果最好。孟珊等[11]对原始光谱进行数学变换及微分变换后,利用竞争自适应重加权采样(CARS)构建了研究区土壤有机碳含量的BP神经网络模型,训练集和验证集R2分别为0.81和0.83,RPD分别为2.30和2.45,RMSE分别为5.75和4.89 g/kg。牛芳鹏等[12]对原始光谱进行SG平滑、标准化正态变换及一阶微分后,利用SPA构建了研究区土壤有机碳含量的SVM模型,其训练集与验证集R2分别为0.83和0.85,RMSE分别为5.59和3.16 g/kg,RPD为2.25。研究利用连续小波变换结合SPA算法构建的SVM模型,其训练集和验证集分别R2=0.76,RMSE=4.78和R2=0.94,RMSE=3.30,RPD=2.50,利用连续小波变换结合连续投影算法构建的SVM模型。影响SVM模型精度的主要因素有待于进一步研究。
4 结 论
4.1
研究区土壤有机碳含量范围为0.69~50.32 g/kg,平均值为14.15 g/kg,标准差为9.51 g/kg,呈中等变异性,变异系数为67.20%。
4.2
土壤原始光谱反射率随着波长的增加发生变化,在350~750 nm,光谱反射率呈上升趋势,在750~2 150 nm,光谱反射率呈相对平稳趋势,从2 150 nm开始至2 500 nm,光谱反射率逐渐下降;连续小波变换对土壤原始光谱预处理后随着分解尺度的增加,光谱局部特征越来越明显,吸收峰和反射峰越来越平滑;采用连续投影算法筛选的光谱特征波段集中于350~952 nm、1 007~1 742 nm、2 082~2 381 nm,且特征波段仅占可见光-近红外光谱的0.30%。
4.3
连续小波变换结合连续投影算法构建的SVM模型,其训练集和验证集分别R2=0.76,RMSE=4.78和R2=0.94,RMSE=3.30,RPD=2.50,可以有效估算研究区的土壤有机碳含量。
参考文献(References)
[1]Gomez C, Viscarra Rossel R A, McBratney A B. Soil organic carbon prediction by hyperspectral remote sensing and field vis-NIR spectroscopy: an Australian case study[J]. Geoderma, 2008, 146(3/4): 403-411.
[2] Shi Z, Ji W, Viscarra Rossel R A, et al. Prediction of soil organic matter using a spatially constrained local partial least squares regression and the Chinese vis-NIR spectral library[J]. European Journal of Soil Science, 2015, 66(4): 679-687.
[3] Wang J P, Wang X J, Zhang J, et al. Soil organic and inorganic carbon and stable carbon isotopes in the Yanqi Basin of northwestern China[J]. European Journal of Soil Science, 2015, 66(1): 95-103.
[4] Ribeiro S G, dos Santos Teixeira A, de Oliveira M R R, et al. Soil organic carbon content prediction using soil-reflected spectra: a comparison of two regression methods[J]. Remote Sensing, 2021, 13(23): 4752.
[5] Amin I, Fikrat F, Mammadov E, et al. Soil organic carbon prediction by vis-NIR spectroscopy: case study the kur-aras plain, Azerbaijan[J]. Communications in Soil Science and Plant Analysis," 2020, 51(6): 726-734.
[6] 朱建伟, 刘玉学, 吴超凡, 等. 施用生物炭后土壤有机碳的近红外光谱模型研究与应用[J]. 生态学报, 2020, 40(20): 7430-7440.
ZHU Jianwei, LIU Yuxue, WU Chaofan, et al. Study on near-infrared spectroscopy model of soil organic carbon after biochar addition and its application[J]. Acta Ecologica Sinica, 2020, 40(20): 7430-7440.
[7] 勾宇轩, 赵云泽, 李勇, 等. 基于CWT-sCARS的东北旱作农田土壤有机质高光谱反演[J]. 农业机械学报, 2022, 53(3): 331-337.
GOU Yuxuan, ZHAO Yunze, LI Yong, et al. Soil organic matter content in dryland farmland in Northeast China with hyperspectral reflectance based on CWT-sCARS[J]. Transactions of the Chinese Society for Agricultural Machinery," 2022, 53(3): 331-337.
[8] 张锐, 李兆富, 潘剑君. 小波包-局部最相关算法提高土壤有机碳含量高光谱预测精度[J]. 农业工程学报, 2017, 33(1): 175-181.
ZHANG Rui, LI Zhaofu, PAN Jianjun. Coupling discrete wavelet packet transformation and local correlation maximization improving prediction accuracy of soil organic carbon based on hyperspectral reflectance[J]. Transactions of the Chinese Society of Agricultural Engineering, 2017, 33(1): 175-181.
[9] 玉米提·买明, 王雪梅. 连续小波变换的土壤有机质含量高光谱估测[J]. 光谱学与光谱分析, 2022, 42(4): 1278-1284.
Yumiti Maiming, WANG Xuemei. Hyperspectral estimation of soil organic matter content based on continuous wavelet transformation[J]. Spectroscopy and Spectral Analysis, 2022, 42(4): 1278-1284.
[10] 廖钦洪, 顾晓鹤, 李存军, 等. 基于连续小波变换的潮土有机质含量高光谱估算[J]. 农业工程学报, 2012, 28(23): 132-139.
LIAO Qinhong, GU Xiaohe, LI Cunjun, et al. Estimation of fluvo-aquic soil organic matter content from hyperspectral reflectance based on continuous wavelet transformation[J]. Transactions of the Chinese Society of Agricultural Engineering, 2012, 28(23): 132-139.
[11] 孟珊, 李新国, 焦黎. 基于CARS算法的湖滨绿洲土壤表层有机碳估算[J]. 环境科学与技术, 2022, 45(8): 218-225.
MENG Shan, LI Xinguo, JIAO Li. Estimation of surface soil organic carbon in lakeside oasis based on CARS algorithm[J]. Environmental Science amp; Technology, 2022, 45(8): 218-225.
[12] 牛芳鹏, 李新国, 麦麦提吐尔逊·艾则孜, 等. 基于连续投影算法的博斯腾湖西岸湖滨绿洲土壤有机碳含量的高光谱估算[J]. 浙江大学学报(农业与生命科学版), 2021, 47(5): 673-682.
NIU Fangpeng, LI Xinguo, Mamattursun Eziz, et al. Hyperspectral estimation of soil organic carbon content in the west lakeside oasis of Bosten Lake based on successive projection algorithm[J]. Journal of Zhejiang University (Agriculture and Life Sciences), 2021, 47(5): 673-682.
[13] 章海亮, 刘雪梅, 何勇. SPA-LS-SVM检测土壤有机质和速效钾研究[J]. 光谱学与光谱分析, 2014, 34(5): 1348-1351.
ZHANG Hailiang, LIU Xuemei, HE Yong. Measurement of soil organic matter and available K based on SPA-LS-SVM[J]. Spectroscopy and Spectral Analysis, 2014, 34(5): 1348-1351.
[14] Peng X T, Shi T Z, Song A H, et al. Estimating soil organic carbon using VIS/NIR spectroscopy with SVMR and SPA methods[J]. Remote Sensing, 2014, 6(4): 2699-2717.
[15] 叶红云, 熊黑钢, 张芳, 等. 基于CWT的人类不同程度干扰下干旱区土壤有机质含量估算研究[J]. 激光与光电子学进展, 2019, 56(5): 051101.
YE Hongyun, XIONG Heigang, ZHANG Fang, et al. CWT-based estimation of soil organic matter content in arid area under different human disturbance degrees[J]. Laser amp; Optoelectronics Progress, 2019, 56(5): 051101.
[16] 牛芳鹏, 李新国, 麦麦提吐尔逊·艾则孜, 等. 基于光谱指数的博斯腾湖西岸湖滨绿洲土壤有机碳含量估算模型[J]. 江苏农业学报, 2022, 38(2): 414-421.
NIU Fangpeng, LI Xinguo, Mamattursun Eziz, et al. Estimation model of soil organic carbon content in lakeside oasis on the west coast of Bosten Lake based on spectral index[J]. Jiangsu Journal of Agricultural Sciences, 2022, 38(2): 414-421.
[17] 艾孜提艾力·克依木, 李新国, 赵慧, 等. 基于地理加权回归模型的绿洲土壤表层有机质含量高光谱估算[J]. 新疆农业科学, 2022, 59(1): 223-230.
Hazirtiali Keyim, LI Xinguo, ZHAO Hui, et al. Hyperspectral estimation of surface soil organic matter content in the oasis based on geographically weighted regression model[J]. Xinjiang Agricultural Sciences," 2022, 59(1): 223-230.
[18] 孙问娟, 李新举. 煤矿区土壤有机碳含量的高光谱预测模型[J]. 水土保持学报, 2018, 32(5): 346-351.
SUN Wenjuan, LI Xinju. Hyperspectral prediction model of soil organic carbon content in coal mining area[J]. Journal of Soil and Water Conservation, 2018, 32(5): 346-351.
[19] 郭斌, 白昊睿, 张波, 等. 基于RF和连续小波变换的露天煤矿土壤锌含量高光谱遥感反演[J]. 农业工程学报, 2022, 38(10): 138-147.
GUO Bin, BAI Haorui, ZHANG Bo, et al. Inversion of soil zinc contents using hyperspectral remote sensing based on random forest and continuous wavelet transform in an opencast coal mine[J]. Transactions of the Chinese Society of Agricultural Engineering, 2022, 38(10): 138-147.
[20] 吴倩, 姜琦刚, 史鹏飞, 等. 基于高光谱的土壤碳酸钙含量估算模型研究[J]. 国土资源遥感, 2021, 33(1): 138-144.
WU Qian, JIANG Qigang, SHI Pengfei, et al. The estimation of soil calcium carbonate content based on Hyperspectral data[J]. Remote Sensing for Land amp; Resources, 2021, 33(1): 138-144.
[21] 杨爱霞, 丁建丽. 新疆艾比湖湿地土壤有机碳含量的光谱测定方法对比[J]. 农业工程学报, 2015, 31(18): 162-168.
YANG Aixia, DING Jianli. Comparative assessment of two methods for estimation of soil organic carbon content by Vis-NIR spectra in Xinjiang Ebinur Lake Wetland[J]. Transactions of the Chinese Society of Agricultural Engineering, 2015, 31(18): 162-168.
[22] 于雷, 洪永胜, 周勇, 等. 连续小波变换高光谱数据的土壤有机质含量反演模型构建[J]. 光谱学与光谱分析, 2016, 36(5): 1428.
YU Lei, HONG Yongsheng, ZHOU Yong, et al. Inversion of soil organic matter content using hyperspectral data based on continuous wavelet transformation[J]. Spectroscopy and Spectral Analysis, 2016, 36(5): 1428.
[23] 赵明松, 谢毅, 陆龙妹, 等. 基于高光谱特征指数的土壤有机质含量建模[J]. 土壤学报, 2021, 58(1): 42-54.
ZHAO Mingsong, XIE Yi, LU Longmei, et al. Modeling for soil organic matter content based on hyperspectral feature indices[J]. Acta Pedologica Sinica," 2021, 58(1): 42-54.
[24] 章涛, 于雷, 易军, 等. 高光谱小波能量特征估测土壤有机质含量[J]. 光谱学与光谱分析, 2019, 39(10): 3217-3222.
ZHANG Tao, YU Lei, YI Jun, et al. Determination of soil organic matter content based on hyperspectral wavelet energy features[J]. Spectroscopy and Spectral Analysis, 2019, 39(10): 3217-3222.
[25] Chen L H, Lai J, Tan K, et al. Development of a soil heavy metal estimation method based on a spectral index: combining fractional-order derivative pretreatment and the absorption mechanism[J]. The Science of the Total Environment, 2022, 813: 151882.
[26] 林鹏达, 佟志军, 张继权, 等. 基于CWT的黑土有机质含量野外高光谱反演模型[J]. 水土保持研究, 2018, 25(2): 46-52, 57.
LIN Pengda, TONG Zhijun, ZHANG Jiquan, et al. Inversion of black soil organic matter content with field hyperspectral reflectance based on continuous wavelet transformation[J]. Research of Soil and Water Conservation, 2018, 25(2): 46-52, 57.
[27] Li R Y, Gao M X, Xu Z X, et al. Hyper-spectral estimation of soil organic matter in apple orchard based on CWT[J]. IOP Conference Series: Earth and Environmental Science, 2021, 734(1): 012030.
[28] 刘翠英, 张津瑞, 曾涛, 等. 傅里叶变换红外光谱的土壤团聚体有机碳和全氮含量估测[J]. 光谱学与光谱分析, 2020, 40(12): 3818-3824.
LIU Cuiying, ZHANG Jinrui, ZENG Tao, et al. Determination of soil organic carbon and total nitrogen contents in aggregate fractions from Fourier transform infrared spectroscopy[J]. Spectroscopy and Spectral Analysis, 2020, 40(12): 3818-3824.
[29] 肖艳, 辛洪波, 王斌, 等. 基于小波变换和连续投影算法的黑土有机质含量高光谱估测[J]. 国土资源遥感, 2021, 33(2): 33-39.
XIAO Yan, XIN Hongbo, WANG Bin, et al. Hyperspectral estimation of black soil organic matter content based on wavelet transform and successive projections algorithm[J]. Remote Sensing for Land amp; Resources, 2021, 33(2): 33-39.
Support vector machines estimation model of soil organic carbon content in lakeside oasis
Abstract:【Objective】 To study rapid estimation of soil organic carbon content using hyperspectral data in the hope of providing scientific basis for rational development of land resources in lakeside oases in arid regions.
【Methods】 The north lakeside oasis of Bosten Lake was taken as the study area and the measured soil organic carbon content data were combined with the hyperspectral data. Successive Projections Algorithm (SPA) was used to screen the successive bands after SG smoothing (SG), Continuum Removal (CR) and Continuous Wavelet Transform (CWT) pre-processing for the original spectra. Support Vector Machines (SVM) models were used to estimate soil organic carbon content.
【Results】" Soil organic carbon content in the study area ranged from 0.69 g/kg to 50.32 g/kg, with an average value of 14.15 g/kg and a standard deviation of 9.51 g/kg, showing moderate variability and coefficient of variation of 67.20%. The original spectral reflectance of soil changed with the increase of wavelength, at 350-750 nm, the spectral reflectance increased, at 750-2,150 nm, the spectral reflectance showed a relatively stable trend; from 2,150 nm to 2,500 nm, the spectral reflectance gradually decreased. With the increase of decomposition scale, the local characteristics of the original spectrum of soil after pretreatment by continuous wavelet transform became more and more obvious, and the absorption and reflection peaks were becoming smoother and smoother. The feature bands selected by the continuous projection algorithm were concentrated in 350-952, 1,007-1,742 and 2,082-2,381 nm, and the feature bands only accounted for 0.30% of the Vis-NIR spectrum. The training set and verification set of the SVM model constructed by continuous wavelet transform and continuous projection algorithm were R2=0.76, RMSE=4.78 and R2=0.94, RMSE=3.30, RPD=2.50, respectively.
【Conclusion】" The CWT-SPA-SVM could be effectively estimate soil organic carbon content in the study area.
Key words:soil organic carbon content; continuous wavelet transform; successive projections algorithm; support vector machines model; hyperspectral data