當前位置:成語大全網 - 新華字典 - 圖件資料信息化

圖件資料信息化

圖件資料是航空物探勘查地質解釋的重要成果之壹,是其他項目進行地質基礎研究和綜合應用研究的基礎資料。多數圖件是以紙介質形式歸檔保存的,不便於再利用。為此,將紙介質圖件掃描,矢量化和信息化,建立圖件資料數據庫,實現圖件資料的信息化管理和服務。

壹、圖件資料信息化流程

根據信息系統的建庫要求,對中心多年來在數字制圖方面的經驗進行了總結,確定了圖件信息化的流程(圖8-1),編寫了圖件資料信息化工作指南,對信息化過程中的各個步驟提出具體技術要求,保證了圖件資料信息化的數據質量。

圖8-1 圖件資料信息化流程圖

二、圖件整理與掃描

對資料室存檔的586個項目(其中勘查458個,科研128個)圖件資料進行了整理。對其中498個項目圖件資料(其他項目沒有圖件)以項目為單位編排工作序號,建立“圖件掃描進度表”。該表包含項目名稱、性質、時間、圖件數量、掃描人和日期等內容。整理項目圖件,確定需要進行掃描的原始圖件,結合附圖目錄,將圖件的有關信息摘錄填入“原始資料收集記錄表”。對於存在較復雜的多幅拼接圖件,查找(繪制)接圖表,統計圖件數量,並填寫“原始資料收集記錄表”。針對項目圖件中存在著圖上標的圖號與附圖目錄中圖件編號不符,或圖件數量不符等現象,重新編排了圖號等。

按編排的工作序號對掃描圖件進行必要的處理,如熨平圖件折疊產生的褶痕、修補圖件破損部分,對部分早期坐標交叉點過少無法進行圖像校正的圖件補繪坐標格網(圖8-2)等。

然後,分批完成414個勘查類項目(石油143個,金屬238個,地面磁測33個)和84個科研項目,計498個項目約圖件3萬多張圖件資料的掃描工作。考慮到保持圖件原貌和節省空間兩個方面的因素,掃描圖像分辨率為254dpi,采用JPG格式保存。

圖8-2 計算圖框角點經緯度坐標

三、圖件信息填寫

按信息系統建設確定的圖件信息填寫規則,以項目為單位建立Excel表,每張圖占壹個數據行,每行包含圖幅號,圖件名,圖件類型,圖件的四個角點坐標,圖比例尺,地理坐標系,投影方式,投影參數,像元大小,圖件說明,制圖單位,制圖人,制圖日期,資料來源等19個數據項。完成381個勘查項目近3萬張圖件信息的填寫工作。

四、圖像糾正

在已填寫圖件信息的381個勘查類項目中,有18個項目圖件坐標信息不滿足圖像校正的條件,對滿足圖像校正要求的363個項目約2.8萬張圖進行了圖像校正。

圖像校正方法是用MapGIS軟件打開圖像文件,按紙質圖的投影坐標和參數來設置圖像的投影坐標和參數。若無法確定紙質圖的投影坐標和參數,參照圖件比例尺進行試驗,找出誤差最小的投影坐標和參數。為小比例尺的圖選擇合適的投影參數比較困難,因為很難猜到原始圖件清繪時使用底圖的投影。制作初期采取選擇兩種類型投影——全國的或地區的,分別制作坐標網,並噴繪在透明紙上,與原圖進行套合比較,整體偏差較小的作為首選。後來考慮到此種方法費時費力,而且使用全國投影,有些地區的圖件會傾斜很大的角度,不利於使用,所以後期圖件都根據地區所在位置設置投影。

利用MapGIS軟件生成標準坐標格網,用於對掃描圖像進行控制點采集及校正處理,填寫“圖像校正情況匯總表”。由於原圖坐標網存在不同間隔繪制的情況,有些測區同比例的圖件需要制作多個標準格網。

利用Excel表提供的統計功能,對每幅圖的誤差進行分類處理,建立“圖像校正誤差統計表”,即顯示了最大誤差及對應控制點。為了便於分析、查找與修改錯誤,將誤差數值和點數按不同值域進行排列,根據誤差分布狀態,結合圖面情況綜合考慮產生問題的原因。比如:控制點放置不準確,原圖繪制有偏差等,采取相應的處理方法減少誤差。部分早期圖件因手工編繪時誤差大,或投影參數配置不太準確(尤其是小比例尺的圖)或折疊存放時間過長,使得圖像糾正的誤差較大。

利用MapGIS圖像處理功能將糾正後的圖像文件格式從JPG轉TIF,再轉為MSI符合入庫要求的圖像格式Sid。

五、圖形矢量化

為了便於將來使用,對321個項目的解釋評價圖件進行了矢量化(其余項目或無解釋評價圖,或圖形實在看不清楚或已有電子文檔)。解釋評價圖件矢量化選用MapGIS軟件。對於多幅拼圖情況,進行了圖像裁減和拼接,並將接圖表和投影參數等填入“圖件矢量化情況登記表”中。

根據圖件類型,對要素進行分類,設定圖元參數時采取了分色表示,便於檢查;而且特別註重了分層處理,以及按類型單獨建立文件。由於圖件和要素種類多,數據文件量大,為了便於使用查找,對文件存放目錄、位置、名稱等都做了詳細規定。

有不少早期圖件圖形分辨不清,圖內要素與圖例圖示不符或遺漏(圖8-3),增加了矢量化的困難和出錯率。為了保證矢量化數據的正確性,要保證圖面清晰無誤,還要做到各種參數設置符合規定;所以實際中繪圖檢查圖面錯誤1次,圖元參數檢查2~3遍。

六、要素屬性提取

在認真閱讀報告和查看圖件的基礎上,對圖中與要素表有關的圖元進行統壹編號,由此產生要素編號圖(圖8-4)。根據圖元編號,對要素信息進行歸納整理,根據要素劃分標準和數據字典要求填寫要素屬性表。完成具備條件的334個(含13個電子版)項目中132個項目的解釋評價圖件的要素提取工作,要素總數71800個左右,和海域6個測區的要素提取工作。

圖8-3 圖元難於分辨的示意圖

中心在報告編寫方面沒有統壹的標準,造成了表達方式的多樣性。屬性表內容的準確性取決於填表專家的理解,這給信息標準化提取和歸納帶來了很大的困難。對壹些難以處理的問題,記錄在“圖件中未登圖元及遺留問題記錄表”中。

七、要素與屬性關聯

完成專家手工填寫的102個項目解釋評價圖件約47600個要素屬性數據和海域6個測區解釋評價圖件的要素屬性數據的錄入工作,並進行校對檢查。依照要素編號圖,對MapGIS矢量數據進行整理,給每個要提取的圖元賦予關鍵字——ID號,保證圖元與要素表中編號具有唯壹對應的關系。將圖元與要素表通過ID號進行關聯處理,使其被賦予要素屬性信息。

對MapGIS屬性數據進行入庫檢查後,轉換為Shape格式,進入ArcGIS進行數據整理核對,定義坐標系等,並輸出要素圖進行檢查。

圖8-4 要素編號圖