8.5.1.1巖性信息產品生成業務流程
采用高光譜巖性信息分類制圖的方法:首先對成像高光譜數據進行輻射定標、大氣校正、光譜重建等過程,得到光譜反射率數據,然後根據礦物特征吸收峰的分布對高光譜反射率數據進行光譜降維,根據現有地質圖選取典型巖性,結合像元純度指數圖在高光譜數據區域建立感興趣區域,確定巖性分類的先驗樣本區域。最後,采用合適的方法進行巖性信息分類成圖,並對結果進行優化。巖性信息分類成圖流程如圖8.20所示。
圖8.20高光譜巖性信息的分類和制圖過程
8.5.1.2巖性分類信息提取的高光譜數據預處理
無論是高光譜成像儀還是傳統的多光譜傳感器,它們記錄的數據都是地面觀測目標的反射或輻射能量的光譜輻射絕對值,與地物的光譜反射率或光譜輻亮度不壹致。因此,輻射定標和光譜重建是地物識別和定量分析中不可或缺的環節。只有經過輻射定標、輻射校正和大氣校正後,才能消除大氣散射、吸收、地形起伏和傳感器本身的不穩定性造成的各種畸變,將記錄的圖像值轉換為地面反照率值,重建像素的地面光譜。根據光譜特征可以有效識別地物並反演其成分。
8.5.1.3端構件選擇
為了提取壹個地區未知的巖性分類信息,通常需要提取巖性端元信息。所謂端元是指成分單壹的巖性像元。只有提取端元才能進壹步分類分析研究區的巖性信息。目前選擇端元的方法主要有兩種:①根據野外光譜測量或從已有的地物光譜信息庫中選擇端元。以這種方式選擇的端元稱為“參考端元”。(2)直接從要分類的巖性圖像中選擇端元,然後不斷修改和調整以確定端元。該圖像上選定的端元區域稱為先驗樣本區域。
通常,需要通過實地調查在野外獲得巖性端元信息。首先選擇好區域,然後選擇合適的時間進行測量。壹般來說,在獲取圖像的同時需要測量地物的光譜,但這非常困難,在實際應用中很少能做到。實地測量得到的參考端元理論上相對準確,但遙感圖像中地物的光譜曲線受大氣、地形和傳感器等因素的影響,與實地測量結果存在較大差異。即使通過對圖像的各種校正進壹步消除了這些因素,它們也不會與實地測量的結果很好地壹致。對於大多數研究區域而言,具有與研究區域相對應的實際地物光譜數據庫的區域很少,很少投入大量人力物力進行實地光譜測量。因此,在沒有野外光譜測量數據的情況下,從圖像本身獲取端元是主要途徑。目前,在從圖像本身獲取像素的方式中,除了直接分析遙感圖像像素的色調和光譜特征外,還可以使用以下分析方法。
基於圖像的端元選擇假設圖像中存在基本上只反映壹種巖性或礦物光譜的“純像素”或“未混合像素”,這些“純像素”通過數學方法自動或交互式地從圖像中提取出來,並將同類“純像素”的典型光譜或平均像素光譜用作端元光譜。PPI方法因其引入較早、計算簡單直觀,以及在應用最廣泛的高光譜數據遙感圖像處理系統ENVI中的功能而得到廣泛應用。然而,在PPI之前,高光譜數據應該進行降維處理。最大噪聲分離(MNF)變換是常用的降維方法。
(1)最大噪聲分離(MNF)變換
成像光譜光譜分辨率高、波段多、數據量大、波段間相關性強、數據冗余度高。在進行端元選擇和礦物識別之前,有必要降低數據的維數並削弱噪聲。最常用的方法是“最大噪聲分量變換”。
MNF變換是利用圖像噪聲分量矩陣的特征向量(∑N∑-1)對圖像進行變換,使按特征值排序的變換分量中包含的噪聲分量逐漸減少,圖像質量依次提高。σ是圖像的總協方差矩陣;∑N是圖像噪聲的協方差矩陣。MNF有兩個重要的屬性。壹種是縮放圖像的任意波段,變換結果保持不變。二是使圖像向量、信息分量和加性噪聲分量相互垂直,達到信息分離的目的。乘性噪聲可以通過對數變換轉換成加性噪聲。變換後,可以對每個分量圖像進行有針對性的去噪,或者丟棄噪聲的主導分量,從而達到對成像光譜數據降維去噪的目的。
(2)像素純度指數分析
基於上述MNF變換,具有低等級的MNF頻帶被暫時忽略,並且只有高等級頻帶被選擇用於進壹步處理。PPI設計指定光譜極值像素,對應於混合光譜端元。PPI是通過將N維散點圖重復投影到隨機細胞向量來計算的。記錄每個投影的極值像素,並記下每個像素被校準為極值的總次數。PPI圖像生成,其中每個像素的DN值對應於該像素被記錄為極值的次數。這些圖像的直方圖顯示了PPI的“命中”分布。從直方圖中選擇閾值以選擇最純的像素,從而確保要分析的像素數量最少。這些像素被輸入到交互式可視化算法中,以分離特定的光譜端元。
③n維可視化。
因為PPI算法本身並不確定最終的端元,而是從圖像的許多像素中選擇包括所有端元像素的較小像素子集。因此,通常需要將PPI的處理結果輸入到n維可視化工具中,並選擇最終的端元像素。
在n維可視化中,光譜可以視為n維散點圖中的壹個點,其中n是波段數。對於給定的像素,N維空間中構成N值的點的坐標是每個波段的光譜反射率。這些點在n維空間中的分布可用於估計光譜端元的數量及其純光譜特征。在二維空間中,如果只有兩個端元混合,混合光譜將落入直方圖的線中。純端元將落入混合線的兩端;如果三個端元混合,混合像素將落入四面體中;我是類比。混合端元介於純端元之間,位於純端元繪制的多面體中。這種混合光譜的凸幾何特征可用於確定端元光譜的數量並估計其光譜特征。PPI選擇的潛在端元光譜被輸入到N維散點圖中進行重復旋轉,以識別純端元。根據前面的分析,好的端元通常出現在N維散點圖的頂點和拐角處。當確定壹系列端元點時,可以將它們輸入圖像中的感興趣區域(ROI),並且可以從圖像中提取每個感興趣區域的平均反射光譜曲線作為用於成像光譜礦物制圖的候選端元。
鑒於PPI算法的結果是從圖像中的許多像素中選擇包含所有端元的較小像素子集(圖8.21),因此可以選擇最純凈的端元區域作為感興趣區域(ROI),以結合現有地質圖中的PPI結果圖進行後期監督分類。
圖8.21所選純像素的光譜曲線。
結果和分析
目前,根據是否需要先驗樣本區域,巖性分類技術可分為非監督分類和監督分類兩大類。無監督分類是指基於數據遙感圖像中地物光譜特征的分布規律,即自然聚類的特征進行“盲”分類,不事先對分類過程施加任何先驗知識;其分類的結果只是區分了不同的類別,但不能確定類別的屬性;分類後通過目視判讀或實地調查確定其類別的屬性。無監督分類也稱為聚類分析。壹般的聚類算法首先選擇幾個模式點作為聚類的中心。每個中心代表壹個類別,根據某種相似性度量方法(如最小距離法),將每個模式分類到每個聚類中心所代表的類別中,形成初始分類。然後,通過聚類準則判斷初始分類是否合理。如果不合理,就修改分類,以此類推,直到合理為止。監督分類也稱為訓練場方法,是壹種基於建立統計識別函數和典型樣本訓練方法的技術。即根據已知訓練區域提供的樣本,選擇特征參數,找出特征參數作為決策規則,建立判別函數對待分類圖像進行分類的壹種模式識別方法。要求培訓區域具有典型性和代表性。如果準則滿足分類精度的要求,則該準則成立;相反,需要重新建立分類決策規則,直到滿足分類精度要求(圖8.22)。
圖8.22地質圖
對原始數據的211波段進行直觀判讀,去除明顯的噪聲波段得到剩余的178波段,用上述方法對這178波段的數據信息進行分類得到所需結果,再結合各種巖性和地質特征可知,大多數礦物特征吸收峰位於1300 nm之後的波段。因此,從178個波段中裁剪出93個波段,並使用相同的方法和參數對裁剪結果進行重新分類,並將結果與第壹次分類的結果進行比較。
8.5.2.1無監督分類制圖結果
(1)K均值
預選的待分類數據可分為8類,最大叠代次數為2,變化閾值設置為5%,即當每類中像素數量的變化小於閾值時,叠代過程結束,不輸入最大允許標準差和最大允許距離誤差,即所有像素均參與分類。因此,當閾值達到5%或叠代達到兩次時,分類結束(圖8.23、圖8.24)。
圖8.23使用的數據:dts_178,K-Means映射結果。
圖8.24使用的數據:resize_dts_93,K-Means映射結果。
ISODATA
待分類的預選數據可分為5 ~ 10類,最大叠代次數為2,變化閾值為5%。每個類別至少包含500個像素,最大允許標準偏差為10,也就是說,如果壹個類別的標準偏差大於10,則將其分為兩個類別。類均值之間的最小允許距離為5,可合並成對的最大對數為5,即當類均值之間的距離小於5時,該類將被合並,合並成對類的最大值為5(圖8.25、圖8.26)。
圖8.25使用的數據:dts_178,ISODATA映射結果。
圖8.26使用的數據:resize_dts_93,ISODATA映射結果。
8.5.2.2監督分類制圖結果
首先,通過對比地質圖和PPI圖像選擇兩種巖性(Cgammabeta:石炭紀黑雲母花崗巖和Cdelta:石炭紀閃長巖)的感興趣區域。
(1)平行六面體
將最大允許標準偏差(平均值的最大標準偏差)設置為1.4(圖8.27、圖8.28)。
圖8.27使用的數據:dts_178,平行六面體映射結果。
圖8.28使用的數據:resize_dts_93,平行六面體映射結果。
②最小距離
如果最大標準差為10,最大允許距離誤差為2500,則兩者中較小的壹個將決定像素是否參與分類。如果超過任何值,該像素將不參與分類,屬於無分類(圖8.29和圖8.30)。
圖8.29數據dts_178,最小距離映射結果
圖8.30數據調整大小_dts_93,最小距離映射結果
③光譜角度制圖
將最大允許角度設置為0.05°,即當像素光譜與末端光譜之間的夾角大於0.05°時,將不參與分類(圖8.31,圖8.32)。
圖8.31使用的數據:dts_178,光譜角度制圖的制圖結果。
圖8.32使用的數據:resize_dts_93,光譜角度映射的映射結果。
④光譜信息發散
將最大散度閾值設置為0.002(圖8.33)。
圖8.33使用的數據:dts_178,光譜信息散度制圖的結果。
⑤二進制編碼
將最小二進制閾值設置為0.95將決定哪些像素參與分類(圖8.34、圖8.35)。
圖8.34使用的數據:dts_178,二進制編碼的映射結果。
圖8.35使用的數據:resize_dts_93,二進制編碼的映射結果。
(6)最小距離(水文地圖數據)
該方法需要設置兩個閾值:Max stdev from Mean;最大距離誤差。通過不同的嘗試,兩個閾值的設置如圖8.36所示。
圖8.36本地映射的效果
(7)光譜信息差異(Hymap數據)
該方法需要設置壹個閾值:最大散度閾值。通過不同的嘗試,參數設置和映射效果如圖8.37所示。
圖8.37閾值= 0.005時光譜信息散度制圖結果
8.5.2.3巖性信息制圖結果分析
為了分析高光譜星載模擬數據的巖性填圖效果(圖8.38),可以將研究區的巖性信息分布圖與地質圖逐像素進行對比。如果研究區域的總點數為n,並且地質圖中的結論與巖性信息分布圖中的結論相同,則認為該點的值為1,最終統計結果中1的數量為n,因此巖性信息識別精度可定義為
高光譜遙感技術原理及其在礦產和能源勘探中的應用
圖8.38巖性提取結果圖
筆者發現巖性分類結果與地質圖的吻合度達到89%,分析產生誤差的主要原因如下(圖8.39):
1)實驗使用的數據為高光譜星載模擬數據,其空間分辨率為30m。隨著分辨率的降低,單個像素對應的地面面積會增加,導致每個像素中的巖性類型更多,巖性之間的影響也會增加。壹方面,由於混合像元的平均效應,目標巖性在像元中的等效豐度將降低,光譜信息將減弱。當壹個像素中目標巖性的當量豐度低於檢測極限時,該巖性將無法識別,導致低含量外圍區和低含量分布區的填充面積減少,點簇分布區的漏識別和線性分布區的間斷分布。這種影響相當於檢測限的降低。另壹方面,當壹個像元中目標巖性的當量豐度高於檢測極限時,它將擴大面狀巖性分布的面積,填充孔洞,連接相鄰社區,修補點簇的分布區域,並在線性區域中產生斑點效應。由於這兩種效應的共同作用,空間分辨率的降低將擴大強異常區(包括高豐度區和光譜對比度高的礦物分布區)的範圍,連接群落和組合點,這將使異常更加醒目,但其細節特征將消失。弱異常區(包括低豐度和低光譜對比度的異常區)和小異常區將被縮小或遺漏;線性異常可能形成斷續分布的小斑塊,使線性特征及其趨勢不明確。因此,在映射的細節上,分辨率越高,映射效果越好,這是映射效果差異的主要原因之壹。
2)輻射校正的精度。無論是高光譜成像儀還是傳統的多光譜傳感器,它們記錄的數據都是地面觀測目標的反射或輻射能量的光譜輻射絕對值,與地物的光譜反射率或光譜輻亮度不壹致。因此,輻射校正和光譜重建是地物識別中不可或缺的環節。但是,校正後的數據不可避免地會丟失壹些信息,因此在後續處理中會出現壹些錯誤。
3)感興趣區域的選擇是監督分類的重要環節。然而,由於通常無法獲得足夠高純度的感興趣區域,因此所選樣本包含多種巖性,這導致後處理中不可避免的誤差。
4)在數據壹定的情況下,各種分類方法中參數的選擇決定了分類效果。但是,由於不可能嘗試所有類型的參數,因此在有限的嘗試後僅選擇結果更好的參數,但不能保證所使用的參數是最合適的參數。
總之,利用高光譜星載模擬數據進行礦產填圖是可行的,可以在壹定程度上識別巖性的類型和分布。
圖8.39對比地質圖(上圖為下方黑框內部分)