Hyperspectral Estimation Model of Soil Conductivity in the Lakeside Oasis Based on Machine Learning Algorithm
-
摘要:
目的 为湖滨绿洲土壤高光谱估算土壤电导率值提供方法支持,实现区域土壤盐分快速估测。 方法 利用实测的土壤电导率值与土壤高光谱数据联合分析,采用竞争自适应重加权采样(CARS)、连续投影算法(SPA)、遗传算法(GA)筛选土壤电导率的特征波段,并基于全波段及特征波段构建BP神经网络(BPNN)、支持向量机(SVM)、极限学习机(ELM)三种机器学习算法模型,引入偏最小二乘模型(PLSR)进行对照,比较其模型精度。 结果 研究区土壤电导率值变化范围0.02~17.22 mS cm−1,平均值为2.61 mS cm−1,变异系数为134.87%,呈现强变异性;CARS、SPA、GA算法筛选的特征波段将建模输入量分别压缩至全波段数量的0.87%、1.68%、0.70%,减少建模输入量,提升建模速率,变量方法的选择CARS > SPA > GA;三种机器学习算法模型均优于PLSR模型,决定系数(R2)平均增加20.57%,相对分析误差(RPD)平均增加17.84%,土壤电导率高光谱估算模型以CARS-SVM最优,训练集与验证集R2分别为0.76和0.75,RMSE分别为1.79 和1.68 mS cm−1,RPD分别为2.04和2.00。土层深度20 ~ 30 cm的土壤电导率高光谱估算模型精度最高,训练集与验证集R2分别为0.83和0.84,RMSE分别1.37和1.77 mS cm−1,RPD分别为2.41和2.50。 结论 基于CARS-SVM的土壤电导率高光谱估算模型精度高,估算能力最优,可以为湖滨绿洲土壤电导率估算提供科学参考。 Abstract:Objective The paper aims to provide method for estimating the soil conductivity of lakeside oasis soil by hyperspectral, so as to realize the rapid estimation of regional soil salinity. Method Combined analysis of soil conductivity values and soil hyperspectral data, competitive adaptive reweighted sampling (CARS), successive projection algorithm (SPA) and genetic algorithm (GA) were used to screen the characteristic bands of soil conductivity. Based on the full band and characteristic band, three machine learning algorithm models, inlcuding BP neural network (BPNN), support vector machine (SVM) and extreme learning machine (ELM), were constructed, and the partial least squares model (PLSR) was introduced for comparing their accuracy. Result The soil conductivity ranged from 0.20 to 17.22 mS cm−1 in the study area, with an average value of 2.61 mS cm−1 and a coefficient of variation of 134.87%, showing strong variability; The characteristic bands screened by the CARS, SPA, and GA algorithms compress the modeling input to 0.87%, 1.68%, and 0.70% of the total number of bands, respectively, which reduced the amount of modeling input and increased the modeling speed. The choice of variable method CARS > SPA > GA; The three machine learning algorithm models were all better than PLSR model. The coefficient of determination (R2) increased by 20.57% and the relative percent deviation (RPD) increased by 17.84% on average. The CARS-SVM was the best model for soil conductivity hyperspectral estimation, with R2 of 0.76 and 0.75 for training set and validation set, respectively, RMSE of 1.79 mS cm−1 and 1.68 mS cm−1, and RPD of 2.04 and 2.00, respectively; The soil conductivity hyperspectral estimation model with a soil depth of 20 ~ 30 cm has the highest accuracy, with R2 of 0.83 and 0.84 for training set and validation set, respectively, RMSE of 1.37 mS cm−1 and 1.77 mS cm−1, and RPD of 2.41 and 2.50, respectively. Conclusion The soil conductivity hyperspectral estimation model based on CARS-SVM has high accuracy and optimal estimation ability, which can provide a scientific reference for the estimation of soil conductivity in lakeside oasis. -
表 1 土壤电导率的统计特征
Table 1. Statistical characteristics of soil electrical conductivity
样本类型
Type of sample样本数
Number最小值
Minimum
(mS cm−1)最大值
Maximum
(mS cm−1)平均数
Average
(mS cm−1)标准差
SD变异系数
CV(%)样本总集 233 0.02 17.22 2.61 3.52 134.87% 训练集 175 0.02 17.22 2.61 3.52 134.87% 验证集 58 0.05 14.50 2.64 3.54 134.09% 0 ~ 10 cm 46 0.06 17.22 2.94 4.10 139.46% 10 ~ 20 cm 47 0.02 14.48 2.74 3.49 127.37% 20 ~ 30 cm 47 0.05 14.00 2.53 3.41 134.78% 30 ~ 40 cm 46 0.03 14.50 2.75 3.67 133.45% 40 ~ 50 cm 47 0.06 14.00 2.14 2.95 137.85% 表 2 特征波段筛选结果
Table 2. Feature band screening results
筛选方法
Screening method变量数量
Number of variable特征波段(nm)
Characteristic bandCARS 16 1486、1487、1519、1520、1951、1984、2061、2348、2350、
2386、2387、2395、2396、2419、2427、2447SPA 31 946、1001、1494、1731、1951、1957、1963、1978、2011、
2063、2226、2309、2323、2344、2348、2352、2358、2365、2370、2392、
2396、2403、2410、2412、2417、2423、2437、2440、2442、2446、2447GA 13 355、956、1972、1973、2104、2153、2260、2344、2347、
2362、2373、2390、2426Full- spectral 1848 350 ~ 1349、1451 ~ 1799、1951 ~ 2449 表 3 基于机器学习算法的土壤电导率估算结果
Table 3. Estimation results of soil electrical conductivity based on machine learning algorithm
模型
Model筛选方法
Screening method训练集
Training set验证集
Verification setR2 RMSE RPD R2 RMSE RPD BPNN CARS 0.73 1.90 1.92 0.75 1.57 2.01 SPA 0.75 1.85 1.99 0.76 1.78 2.03 GA 0.57 2.36 1.52 0.53 2.40 1.46 Full-spectral 0.72 1.82 1.87 0.73 2.62 1.94 SVM CARS 0.76 1.79 2.04 0.75 1.68 2.00 SPA 0.72 2.04 1.89 0.73 1.34 1.94 GA 0.63 2.36 1.64 0.64 1.91 1.67 Full- spectral 0.70 2.07 1.82 0.66 2.55 1.72 ELM CARS 0.71 1.91 1.85 0.72 1.95 1.89 SPA 0.67 2.10 1.73 0.67 1.91 1.73 GA 0.59 2.24 1.57 0.60 2.36 1.59 Full- spectral 0.57 2.37 1.52 0.59 2.18 1.57 PLSR CARS 0.61 2.29 1.59 0.61 2.01 1.60 SPA 0.57 2.38 1.53 0.57 2.14 1.53 GA 0.49 2.46 1.40 0.52 2.57 1.44 Full- spectral 0.56 2.40 1.52 0.56 2.11 1.51 表 4 CARS算法筛选特征波段
Table 4. CARS algorithm to screen characteristic bands
土层深度(cm)
Soil Depth变量数量
Number of variables特征波段(nm)
Characteristic band0 ~ 10 7 1959、2275、2285、2307、2395、2417、2447 10 ~ 20 16 938、1153、1154、1690、1692、1750、1982、1983、2165、
2168、2351、2352、2384、2393、2394、244520 ~ 30 10 1962、1975、1977、2020、2021、2350、2395、2404、2413、2439 30 ~ 40 7 1968、1969、2037、2350、2391、2396、2415 40 ~ 50 26 670、672、837、838、839、840、841、842、935、963、1951、1962、1963、2009、
2233、2325、2327、2387、2393、2394、2397、2404、2408、2418、2428、2437表 5 基于CARS-SVM的土壤电导率估算结果
Table 5. Estimation results of soil electrical conductivity based on CARS-SVM
模型
Model土层深度
Soil depth训练集
Training set验证集
Verification setR2 RMSE RPD 线性方程
Linear equationR2 RMSE RPD 线性方程
Linear equatiomCARS-SVM 0 ~ 10 0.54 3.03 1.47 y = 0.42x + 1.01 0.66 5.85 1.72 y = 1.85x − 0.42 10 ~ 20 0.56 2.54 1.50 y = 0.41x + 0.68 0.59 2.40 1.56 y = 0.49x + 0.65 20 ~ 30 0.83 1.37 2.41 y = 0.77x + 0.20 0.84 1.77 2.50 y = 0.80x − 0.19 30 ~ 40 0.78 1.89 2.11 y = 0.72x + 0.71 0.75 1.50 1.99 y = 1.15x + 0.16 40 ~ 50 0.69 1.37 1.79 y = 0.49x + 0.63 0.66 3.44 1.71 y = 0.31x + 0.87 -
[1] 曹肖奕, 丁建丽, 葛翔宇, 等. 基于不同卫星光谱模拟的土壤电导率估算研究[J]. 干旱区地理, 2020, 43(1): 172 − 181. [2] 李 相, 丁建丽, 侯艳军, 等. 干旱半干旱区土壤含盐量和电导率高光谱估算[J]. 冰川冻土, 2015, 37(4): 1050 − 1058. [3] Chen K, Li C, Tang R N. Estimation of the nitrogen concentration of rubber tree using fractional calculus augmented NIR spectra[J]. Industrial Crops & Products, 2017, 108: 832 − 839. [4] 赵 慧, 李新国, 靳万贵, 等. 基于地理加权回归模型的博斯腾湖湖滨绿洲土壤盐分离子含量高光谱估算[J]. 土壤, 2021, 53(3): 646 − 653. [5] 罗德芳, 冯春晖, 吴家林, 等. 基于电磁感应协同野外原位光谱的土壤盐分反演研究[J]. 中国土壤与肥料, 2020, (6): 107 − 113. [6] Zhao W, Sánchez N, Lu H, et al. A spatial downscaling approach for the SMAP passive surface soil moisture product using random forest regression[J]. Journal of Hydrology, 2018, 563: 1009 − 1024. doi: 10.1016/j.jhydrol.2018.06.081 [7] 杨丽萍, 侯成磊, 苏志强, 等. 基于机器学习和全极化雷达数据的干旱区土壤湿度反演[J]. 农业工程学报, 2021, 37(13): 74 − 82. doi: 10.11975/j.issn.1002-6819.2021.13.009 [8] 王 涛, 喻彩丽, 张楠楠, 等. 基于去包络线和连续投影算法的枣园土壤电导率光谱检测研究[J]. 干旱地区农业研究, 2019, 37(5): 193 − 199 + 217. [9] 唐海涛, 孟祥添, 苏循新, 等. 基于CARS算法的不同类型土壤有机质高光谱预测[J]. 农业工程学报, 2021, 37(2): 105 − 113. [10] 于 雷, 洪永胜, 周 勇, 等. 高光谱估算土壤有机质含量的波长变量筛选方法[J]. 农业工程学报, 2016, 32(13): 95 − 102. doi: 10.11975/j.issn.1002-6819.2016.13.014 [11] 乔 天, 吕成文, 肖文凭, 等. 基于遗传算法的土壤质地高光谱预测模型研究[J]. 土壤通报, 2018, 49(4): 773 − 778. [12] 亚森江·喀哈尔, 杨胜天, 尼格拉·塔什甫拉提, 等. 基于分数阶微分优化光谱指数的土壤电导率高光谱估算[J]. 生态学报, 2019, 39(19): 7237 − 7248. [13] 赵 慧, 李新国, 靳万贵, 等. 基于分数阶微分的博斯腾湖湖滨绿洲土壤电导率高光谱估算[J]. 甘肃农业大学学报, 2021, 56(1): 118 − 125. [14] 王雪梅, 玉米提·买明, 毛东雷, 等. 干旱区绿洲耕层土壤重金属铬含量的高光谱估测[J]. 生态环境学报, 2021, 30(10): 2076 − 2084. [15] 田安红, 付承彪, 熊黑钢, 等. BPNN对不同人为活动区域的盐渍土Na + 高光谱估测[J]. 水土保持研究, 2020, 27(2): 364 − 369. [16] Rocha Neto O, Teixeira A, Leão R, et al. Hyperspectral Remote Sensing for Detecting Soil Salinization Using ProSpec TIR-VS Aerial Imagery and Sensor Simulation[J]. Remote Sensing, 2017, 9(1): 1 − 16. [17] Bao N S, Wu L X, Ye B Y, et al. Assessing soil organic matter of reclaimed soil from a large surface coal mine using a field spectroradiometer in laboratory[J]. Geoderma, 2017, 288: 47 − 55. doi: 10.1016/j.geoderma.2016.10.033 [18] 蔡亮红, 丁建丽. 基于变量优选和ELM算法的土壤含水量预测研究[J]. 光谱学与光谱分析, 2018, 38(7): 2209 − 2214. [19] 曹肖奕, 丁建丽, 葛翔宇, 等. 基于光谱指数与机器学习算法的土壤电导率估算研究[J]. 土壤学报, 2020, 57(04): 867 − 877. [20] Xiang Y, Liu Q, Wang Y B, et al. Evaluation of MLSR and PLSR for estimating soil element contents using visible/near-infrared spectroscopy in apple orchards on the Jiaodong peninsula[J]. Catena, 2016, 137: 340 − 349. doi: 10.1016/j.catena.2015.09.024 [21] 葛翔宇, 丁建丽, 王敬哲, 等. 基于竞争适应重加权采样算法耦合机器学习的土壤含水量估算[J]. 光学学报, 2018, 38(10): 393 − 400. [22] 曾 胤, 陆宇振, 杜昌文, 等. 应用红外光声光谱技术及支持向量机模型测定土壤有机质含量[J]. 土壤学报, 2014, 51(6): 1262 − 1269. [23] 赵 慧, 李新国, 牛芳鹏, 等. 博斯腾湖湖滨绿洲土壤电导率高光谱估算模型[J]. 中国土壤与肥料, 2021, 2: 289 − 295. doi: 10.11838/sfsc.1673-6257.20036 [24] 牛芳鹏, 李新国, 麦麦提吐尔逊·艾则孜, 等. 基于连续投影算法的博斯腾湖西岸湖滨绿洲土壤有机碳含量的高光谱估算[J]. 浙江大学学报(农业与生命科学版), 2021, 47(5): 673 − 682. [25] 张子鹏, 丁建丽, 王敬哲. 基于谐波分析算法的干旱区绿洲土壤光谱特性研究[J]. 光学学报, 2019, 39(2): 391 − 401. [26] 吾木提·艾山江, 买买提·沙吾提, 马春玥. 基于分数阶微分和连续投影算法-反向传播神经网络的小麦叶片含水量高光谱估算[J]. 激光与光电子学进展, 2019, 15: 251 − 259. [27] 董 哲, 杨武德, 朱洪芬, 等. 基于连续投影算法与BP神经网络的玉米叶片SPAD值高光谱估算[J]. 山西农业科学, 2019, 47(5): 751 − 755. doi: 10.3969/j.issn.1002-2481.2019.05.12 [28] 刘翠英, 张津瑞, 曾 涛, 等. 傅里叶变换红外光谱的土壤团聚体有机碳和全氮含量估测[J]. 光谱学与光谱分析, 2020, 40(12): 3818 − 3824. [29] 孙亚楠, 李仙岳, 史海滨, 等. 河套灌区土壤水溶性盐基离子高光谱综合反演模型[J]. 农业机械学报, 2019, 50(05): 344 − 355. [30] 肖云飞, 高小红, 李冠稳. 土壤有机质可见光-近红外光谱预测样本优化选择[J]. 土壤, 2020, 52(2): 404 − 413. [31] 韩 宁, 陈蜀江, 朱 选, 等. 基于冗余分析的伊犁新垦绿洲不同农田土壤盐渍化特征研究[J]. 西南农业学报, 2019, 32(2): 366 − 372. [32] 孙问娟, 李新举. 煤矿区土壤有机碳含量的高光谱预测模型[J]. 水土保持学报, 2018, 32(5): 346 − 351. [33] 赵明松, 谢 毅, 陆龙妹, 等. 基于高光谱特征指数的土壤有机质含量建模[J]. 土壤学报, 2021, 58(1): 42 − 54. [34] 杨爱霞, 丁建丽. 新疆艾比湖湿地土壤有机碳含量的光谱测定方法对比[J]. 农业工程学报, 2015, 31(18): 162 − 168. doi: 10.11975/j.issn.1002-6819.2015.18.023 [35] 李冠稳, 高小红, 肖能文, 等. 基于sCARS-RF算法的高光谱估算土壤有机质含量[J]. 发光学报, 2019, 40(8): 1030 − 1039. [36] 吕美蓉, 任国兴, 李雪莹, 等. 可见-近红外光谱的潮间带沉积物有机碳含量的几种模型预测方法[J]. 光谱学与光谱分析, 2020, 40(4): 1082 − 1086.