引 言
近年來(lái),土壤重金屬污染已經(jīng)成為一個(gè)嚴(yán)重的環(huán)境問(wèn)題,尤其是在城市快速擴(kuò)張、工業(yè)迅速發(fā)展的國(guó)家和地區(qū),研究表明,我國(guó)耕地土壤重金屬污染的概率約為16.67%,土壤重金屬污染的面積大約占據(jù)耕地總面積的六分之一。Pb是土壤中常見的一種重金屬污染物,滲透迚土壤中后移動(dòng)性較差,殘留時(shí)間長(zhǎng),不僅影響農(nóng)作物質(zhì)量,人類的健康,而且會(huì)影響整個(gè)生態(tài)系統(tǒng)的安全。因此,開展土壤重金屬Pb含量調(diào)查和監(jiān)測(cè)方法研究具有重要意義。高光譜遙感通過(guò)獲取連續(xù)且精細(xì)的土壤反射光譜,能夠體現(xiàn)出土壤成分的細(xì)微變化,具有低成本大范圍快速監(jiān)測(cè)土壤重金屬狀況的潛力。
迄今為止,大多數(shù)研究聚焦進(jìn)行建模。野外光譜會(huì)受到環(huán)境因素(土壤粒徑和含水量等)的影響,且由于土壤樣本難以獲取,樣本數(shù)一般偏少,導(dǎo)致數(shù)據(jù)差異性不足。目前去除環(huán)境因素的光譜轉(zhuǎn)換算法主要包括:Spiking、外部參數(shù)矯正(EPO)算法以及直接矯正(DS)算法,這些環(huán)境因素除去算法在土壤有機(jī)質(zhì)(碳)和粘土含量等屬性參量高光譜反演方面有較好的應(yīng)用,但在土壤重金屬反演方面的應(yīng)用還鮮有觸及。現(xiàn)有研究大多以全譜段建模為主,未能充分利用土壤組分對(duì)土壤重金屬的吸附作用機(jī)理。土壤光譜曲線上很難直接探測(cè)到土壤重金屬的自身光譜特征,直接通迆土壤重金屬的光譜響應(yīng)特征反演重金屬含量不可行,然而通過(guò)借助重金屬元素與土壤光譜活性物質(zhì)(有機(jī)質(zhì)、黏土礦物、鐵氧化物)之間的吸附或賦存關(guān)系,可以間接反演土壤重金屬元素含量,此為土壤重金屬的高光譜間接反演機(jī)理。
本文以河北雄安一般農(nóng)作區(qū)為例,利用野外光譜開展重金屬Pb含量反演的研究,本文在去除環(huán)境因素對(duì)野外光譜影響的基礎(chǔ)上,通過(guò)結(jié)合野外光譜與實(shí)驗(yàn)室光譜建模的方法,提高樣本的差異性,以期提高反演精度。同時(shí),研究中提取了對(duì)重金屬Pb起主要吸附作用的土壤光譜活性物質(zhì)的特征譜段作為模型的輸入,探討了特征譜段建模相對(duì)于全譜段建模的有效性。
1研究數(shù)據(jù)與預(yù)處理
1.1 研究數(shù)據(jù)
土壤樣本采集的時(shí)間為2018 年9 月,采集地點(diǎn)主要在河北雄安新區(qū)的雄縣和安新縣的一般農(nóng)作區(qū)農(nóng)田。野外光譜采集可使用的是萊森光學(xué) iSpecField-WNIR地物光譜儀,測(cè)量波長(zhǎng)范圍為250-2500nm,共獲取70 個(gè)樣點(diǎn)的土壤樣本及配套野外土壤光譜。將土壤樣本在實(shí)驗(yàn)室風(fēng)干研磨后分別過(guò)20 目和100 目篩制成標(biāo)準(zhǔn)樣,一部分用于電感耦合等離子體質(zhì)譜儀ICP-MS測(cè)定Pb 含量,另一部分用于測(cè)定實(shí)驗(yàn)室光譜,測(cè)量?jī)x器同野外光譜采集。
1.2 數(shù)據(jù)預(yù)處理
野外光譜測(cè)量時(shí), 大氣中的水汽在1400nm 和1900nm 處存在強(qiáng)吸收, 且1900~2500nm 區(qū)間的光譜存在較嚴(yán)重噪聲。為去除大氣水汽等噪聲影響,幵保留盡可能多的光譜區(qū)間,將1800nm 之后的光譜波段從土壤野外光譜中剔除,對(duì)350~1800nm光譜使用分段SG 濾波迚行去噪處理,其中890~1020nm 和1330~1520nm 為中等噪聲,采用窗口大小為15 的二次多項(xiàng)式,其余區(qū)間為輕度噪聲,采用窗口大小為7 的二次多項(xiàng)式。利用去除噪聲后的350~1800nm 的野外光譜進(jìn)行土壤鐵氧化物特征譜段提取及重金屬含量估算。
實(shí)驗(yàn)室光譜在350~1800nm 區(qū)間存在不同程度的光譜噪聲,同樣采取分段SG 濾波處理,350~500nm 和1000~1800nm 為中度噪聲區(qū)間,采用窗口大小為15 的二次多項(xiàng)式進(jìn)行噪聲去除;剩余的500~900nm 為輕度噪聲區(qū)間,采用窗口大小為7 的二次多項(xiàng)式進(jìn)行噪聲去除。
2 研究方法
2.1 鐵氧化物特征譜段提取
遙感反射率 Rrs=Lw/Ed(0+) , 即對(duì)水體的遙感反射率的計(jì)算必須要測(cè)量水體的離水輻亮度 Lw與水體表面 入射輻照度 Ed(0+) 。
土壤中對(duì)Pb 起主要吸附作用的物質(zhì)為鐵氧化物,有研究表明,鐵氧化物的吸收特征在500nm和950nm附近的吸收峰。因此,本文從雄安70條有效土壤光譜中提取500nm和950nm為中心的鐵氧化物吸收峰,提取波段區(qū)間為Bm-W/4,Bm+W/4,其中是最大的吸收波段, 是吸收區(qū)域的寬度,最終鐵氧化物特征譜段提取出的光譜波段范圍為450.7~523.2nm 以及914.2~1027.9nm。
圖1 方法技術(shù)路線
2.2 DS轉(zhuǎn)換算法
DS 算法是一種常用的環(huán)境因素去除算法,它的目的是為了通過(guò)轉(zhuǎn)換數(shù)據(jù)集,根據(jù)對(duì)應(yīng)的野外光譜和實(shí)驗(yàn)室光譜之間的關(guān)系,計(jì)算出轉(zhuǎn)換矩陣幵對(duì)野外光譜進(jìn)行轉(zhuǎn)換,去除野外光譜上環(huán)境因素的影響,如水分、顆粒大小和溫度的影響。
在DS 轉(zhuǎn)換的過(guò)程中,需要選擇有代表性和差異性的土壤樣本作為轉(zhuǎn)換集,用于計(jì)算轉(zhuǎn)換矩陣,因此本文用Kennard-Stone 算法來(lái)篩選樣本,具體步驟如下:
1. 首先計(jì)算兩兩樣本之間距離,選擇距離最大的兩個(gè)樣本;
2. 然后分別計(jì)算剩余樣本與已選兩樣本之間的距離;
3. 對(duì)于每個(gè)剩余樣本而言,計(jì)算其與已選各樣本之間的最短距離,選擇這些最短距離中相對(duì)最大的距離所對(duì)應(yīng)的樣本,作為新入選的樣本;
4. 重復(fù)步驟3,直至所選樣本的個(gè)數(shù)等于事先設(shè)定的數(shù)目為止。
2.3 GA-PLSR建模
在高光譜建模中,波段選擇有利于降低模型復(fù)雜度,同時(shí)提高模型估算精度。遺傳算法(GA)是一種隨機(jī)的全局尋優(yōu)算法,在偏最小二乘回歸(PLSR)建模中被認(rèn)為是一種有效的波段選擇算法。GA-PLSR已經(jīng)被用于土壤反射光譜估算有機(jī)碳和重金屬含量研究,取得了降低模型復(fù)雜度和提高模型估算精度的效果。因此,本文采用GA-PLSR 構(gòu)建土壤重金屬含量反演模型。
參考已有GA-PLSR 建模研究,將GA參數(shù)設(shè)置為:染色體個(gè)數(shù)20,迭代次數(shù)1000,代際間隙90%,基因變異概率10%。本文中用均方根誤差(ror,RMSE)作為GA 算法中適應(yīng)度的評(píng)判標(biāo)準(zhǔn),即目標(biāo)函數(shù),用RMSE 值小的個(gè)體替換父一代中RMSE 值大的個(gè)體,不斷反饋產(chǎn)生新解進(jìn)行下一輪迭代,直到達(dá)到最大的迭代次數(shù),最終將RMSE 最小的個(gè)體作為最優(yōu)解輸出,認(rèn)為此時(shí)建立的PLSR 為最優(yōu)的模型。
2.4 模型評(píng)價(jià)標(biāo)準(zhǔn)
精度評(píng)定采用預(yù)測(cè)均方根誤差(RMSEP)、剩余估算偏差(RPD) 和決定系數(shù)(R2)3 個(gè)評(píng)價(jià)指標(biāo)。3 個(gè)評(píng)價(jià)指標(biāo),RMSEP 值越小,RPD 值越大,R2值越接近1,說(shuō)明反演模型的精度越高;反之,RMSEP 值越大,RPD 值越小,R2值越小,說(shuō)明反演模型的精度越低,本文模型優(yōu)劣參考現(xiàn)有的土壤屬性含量高光譜估算的評(píng)價(jià)標(biāo)準(zhǔn):出色模型,R2> 0.9;良好模型,0.9 > R2 > 0.8;近似模型,0.8 > R2> 0.65;具有一定估算能力,0.65 > R2> 0.50;不具備估算能力,0.50 > R2。
3實(shí)驗(yàn)結(jié)果與分析
3.1 樣本集劃分
遙感反射率 Rrs=Lw/Ed(0+) , 即對(duì)水體的遙感反射率的計(jì)算必須要測(cè)量水體的離水輻亮度 Lw與水體表面 入射輻照度 Ed(0+) 。
表1 樣本集Pb含量統(tǒng)計(jì)(mg/kg)
本文將經(jīng)過(guò)數(shù)據(jù)預(yù)處理后的70 個(gè)樣本按照2:1 的比例劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集包括47 個(gè)樣本,測(cè)試集包括23 個(gè)樣本,訓(xùn)練集用于進(jìn)行PLSR 模型建立時(shí)訓(xùn)練模型,測(cè)試集用于帶入訓(xùn)練后的模型中估算重金屬Pb 的含量,幵計(jì)算評(píng)價(jià)指標(biāo),評(píng)估模型估算能力。樣本集的數(shù)據(jù)統(tǒng)計(jì)如表1 所示,從表中可看出劃分的訓(xùn)練集和測(cè)試集與總樣本集的統(tǒng)計(jì)特征基本一致。
3.2 DS轉(zhuǎn)換集大小設(shè)定
遙感反射率 Rrs=Lw/Ed(0+) , 即對(duì)水體的遙感反射率的計(jì)算必須要測(cè)量水體的離水輻亮度 Lw與水體表面 入射輻照度 Ed(0+) 。
DS 轉(zhuǎn)換算法涉及到轉(zhuǎn)換集的大小設(shè)定,而轉(zhuǎn)換集選擇的樣本個(gè)數(shù)影響反演模型的精度,本文實(shí)驗(yàn)了不同轉(zhuǎn)換集大小對(duì)應(yīng)的反演精度,結(jié)果如圖2 所示(由于三種精度指標(biāo)同步變化,此處僅展示R2),從圖中可以看出,當(dāng)轉(zhuǎn)換集的樣本個(gè)數(shù)為30 時(shí),反演模型的精度最高,因此本文選取30 個(gè)樣本的轉(zhuǎn)換集迚行轉(zhuǎn)換矩陣計(jì)算。
圖2 不同轉(zhuǎn)換集大小對(duì)應(yīng)建模精度
圖3 反射光譜曲線
將轉(zhuǎn)換集中對(duì)應(yīng)的野外光譜和實(shí)驗(yàn)室光譜按照2.2 節(jié)中的步驟與公式進(jìn)行計(jì)算得到轉(zhuǎn)換矩陣,用轉(zhuǎn)換矩陣對(duì)所有70 個(gè)樣本的野外光譜迚行處理,獲得DS 校正后的野外光譜。校正效果如圖3 所示
由圖3 可看出,經(jīng)過(guò)DS 轉(zhuǎn)換后的野外光譜,波形與實(shí)驗(yàn)室反射光譜相似,光譜也變得更為平滑,表明通過(guò)DS 轉(zhuǎn)換,能夠較好地去除環(huán)境因素(土壤粒徑、含水量等)對(duì)野外光譜的影響。
3.3 DS校正及聯(lián)合建模精度分析
遙感反射率 Rrs=Lw/Ed(0+) , 即對(duì)水體的遙感反射率的計(jì)算必須要測(cè)量水體的離水輻亮度 Lw與水體表面 入射輻照度 Ed(0+) 。
本節(jié)分別采用原始野外光譜、DS 校正后的野外光譜,聯(lián)合DS 校正的野外光譜與實(shí)驗(yàn)室光譜進(jìn)行建模,比較三種光譜的重金屬Pb 估算精度,以及全譜段建模與鐵氧化物特征譜段建模的反演精度。為了避免實(shí)驗(yàn)的偶然性,每組建模實(shí)驗(yàn)均運(yùn)算五次,取精度最優(yōu)值作為模型的反演精度。
3.3.1 不同光譜數(shù)據(jù)建模精度對(duì)比分析
圖 4 為未經(jīng)DS 校正的野外光譜單獨(dú)建模的結(jié)果,R2 僅為0.5137,屬于具有一定估算能力的模型,可見直接利用野外光譜進(jìn)行重金屬Pb 含量反演時(shí)精度較低。
圖4 原始野外光譜Pb含量估算結(jié)果
圖 5 為DS 校正后的野外光譜獨(dú)立建模結(jié)果,R2 由原始野外光譜建模的0.5137 提高到了0.6276,精度有了明顯提升,說(shuō)明DS算法去除野外光譜的環(huán)境因素影響的有效性。但是,所建模型仍屬于具有一定估算能力的模型,從散點(diǎn)圖中可看出,部分樣本的預(yù)測(cè)值和測(cè)量值之間還存在著較大的差距,精度尚有待提升。
圖 5 為DS校正后的野外光譜獨(dú)立建模結(jié)果
圖6 DS野外光譜與實(shí)驗(yàn)室光譜聯(lián)合建模的Pb含量估算結(jié)果
結(jié)合 DS 校正的野外光譜和實(shí)驗(yàn)室光譜的建模結(jié)果如圖6,樣本點(diǎn)緊密分布于擬合線附近,精度R2 可以達(dá)到0.9146,屬于出色模型,由此可見,通過(guò)聯(lián)合建模增強(qiáng)了樣本的差異性從而使得反演精度得到大幅提高。
3.3.2 鐵氧化物特征譜段建模的有效性分析
表 2 中展示了三類光譜數(shù)據(jù)分別以全譜段和鐵氧化物特征譜段作為GA-PLSR輸入時(shí)的反演精度。除了DS校正野外光譜的全譜段與鐵氧化物特征譜段反演精度相當(dāng)外,其他兩類光譜數(shù)據(jù)的鐵氧化物特征譜段反演精度均高于全譜段反演精度,根據(jù)模型評(píng)價(jià)標(biāo)準(zhǔn),對(duì)于未迚行DS 校正的野外光譜而言,通過(guò)鐵氧化物特征譜段提取,建模精度R2 從0.22 提升到0.5137,精度得到了大幅的提升,反演模型從不具備估算能力提升為具有一定估算能力;聯(lián)合建模的精度R2從0.8952 提升到0.9146,使得反演模型從良好模型提升為出色模型,證明了提取500nm 和950nm的鐵氧化物特征譜段對(duì)于提高土壤重金屬Pb反演精度的有效性。
表2 反演精度對(duì)比
4結(jié) 論
本文針對(duì)環(huán)境因素對(duì)土壤野外光譜乃至土壤重金屬含量高光譜遙感反演的影響、土壤樣本不足及全譜段建模機(jī)理性不足問(wèn)題,以土壤重金屬Pb為例,開展了基于野外光譜的土壤重金屬含量反演方法研究,首先采用DS算法去除環(huán)境因素對(duì)野外光譜的影響,在此基礎(chǔ)上聯(lián)合野外與實(shí)驗(yàn)室光譜,提取對(duì)Pb起主導(dǎo)吸附作用的鐵氧化物的特征譜段用于反演建模,在增強(qiáng)樣本的差異性的同時(shí),增強(qiáng)反演的機(jī)理性。以雄安一般農(nóng)作區(qū)土壤數(shù)據(jù)集為例,分析了該方法對(duì)提高Pb 含量反演精度的有效性。
研究表明,DS 轉(zhuǎn)換算法能夠去除環(huán)境因素對(duì)野外光譜的影響,與原始野外光譜建模相比,反演精度R2 從0.5137 提升到了0.6276;聯(lián)合野外光譜與實(shí)驗(yàn)室光譜建模的方法,有利于提高樣本的差異性,引入噪聲極少的先驗(yàn)知識(shí)后,反演精度得到大幅提升,R2 達(dá)到0.9146,使得反演模型達(dá)到了出色模型的標(biāo)準(zhǔn)。
除了DS校正的野外光譜,全譜段反演精度與鐵氧化物特征譜段反演精度大致相當(dāng)外,其他光譜類型的結(jié)果皆為鐵氧化物特征譜段反演精度顯著優(yōu)于全譜段反演精度,表明通過(guò)提取對(duì)重金屬Pb起主要吸附作用的鐵氧化物的特征譜段,降低了數(shù)據(jù)的冗余度,提高了反演的機(jī)理性,對(duì)于提高模型反演精度是有效的,且本文提取的鐵氧化物波段在500nm 和950nm的吸收特征對(duì)于重金屬Pb 來(lái)說(shuō)確實(shí)是敏感有效的特征譜段。
由于野外光譜與同步或準(zhǔn)同步獲取的航空/衛(wèi)星高光譜圖像在土壤自然狀態(tài)上最為接近,基于野外光譜的反演方法研究將為高光譜遙感圖像反演土壤重金屬含量奠定基礎(chǔ)。本文方法通過(guò)環(huán)境因素去除以及基于鐵氧化物特征譜段建模,聯(lián)合野外與實(shí)驗(yàn)室光譜顯著提高了土壤Pb含量反演精度,未來(lái)可嘗試將該方法應(yīng)用于同一研究區(qū)或同類的多個(gè)研究區(qū)的多源光譜數(shù)據(jù)(實(shí)驗(yàn)室、野外、圖像光譜),探討提高基于高光譜圖像反演土壤重金屬含量精度的可行性。
審核編輯:湯梓紅
評(píng)論