(中國石化石油勘探開發研究院信息技術研究所,北京100083)
目前,各種IT規劃方法和軟件工程方法在指導石油企業規劃數據資源時,需要結合石油勘探開發數據資源管理的特點。分析了石油勘探開發數據資源管理的現狀和特點,提出了壹種業務驅動的石油勘探開發數據資源規劃方法,給出了構建勘探開發業務模型、數據資源目錄和數據中心整體結構的方法,為石油勘探開發數據資源規劃提供了壹套完整的方法論。
關鍵詞數據資源業務驅動商業模式數據中心
石油勘探開發方法研究
基於業務驅動的數據資源規劃
溫碧龍、紀
(信息技術、勘探和生產研究部
中國石化研究院,北京100083
摘要為了指導數據資源規劃,需要根據石油數據資源管理的特點,明確信息技術規劃方法和軟件工程理論。分析了石油勘探開發數據資源管理的特點,提出了基於業務驅動的數據資源規劃方法,給出了石油勘探開發業務模型和數據資源目錄的構建方法以及數據中心的體系結構。這些為規劃石油勘探和生產數據資源提供了完整的方法。
關鍵詞數據資源;業務驅動;商業模式;數據中心
在油氣勘探開發綜合研究過程中,需要從國內外油田收集大量數據,綜合研究成果包含大量數據,如各種圖表和報告。為了管理和應用這些數據,各研究部門開展了與項目研究相關的數據管理系統建設,但由於缺乏統壹規劃,數據資源建設和管理存在以下問題:數據庫建設“小、散、雜”,管理難度大;數據分散存儲,數據之間邏輯關聯度低,無法集成共享;數據收集困難;缺乏專門的數據服務機制導致數據應用困難。因此,需要對油氣勘探開發綜合研究的勘探開發數據資源進行統壹規劃,即進行數據管理和應用需求分析,統籌設計數據中心建設方案。
數據資源規劃的方法主要基於軟件工程理論和各種IT戰略規劃方法論。目前,大多數國際知名IT咨詢公司都采用了TOGAF企業架構框架等企業架構(EA)的先進理論方法,並制定了自己的IT規劃方法論,並在企業規劃咨詢項目中得到應用,取得了良好的效果【1】。對於數據資源,高福賢總結了壹套基於信息工程方法論的信息資源規劃(IRP)方法【2】。IRP方法以面向主題數據庫的總體數據規劃方法為基礎,按照壹定的方法步驟,利用有效的軟件支持工具分析各功能域的信息需求和數據流,制定信息資源管理的基本標準,建立全域及各功能域的信息系統框架——功能模型、數據模型和系統架構模型。
根據EA理論和IRP方法,結合油氣勘探開發綜合研究的特點,提出了壹套業務驅動的勘探開發數據資源規劃方法。
1數據規劃的基本思想
數據資源規劃采用科學合理的方法,對企業生產經營中產生和使用的數據的相關內容、標準、技術、軟件、人員和支撐條件進行全面梳理、優化和設計,提出數據資源采集、傳輸、存儲、應用和管理的綜合解決方案,使企業提高數據的享受性,降低數據采集、管理和應用的成本,充分發揮數據資源的最大作用。
數據資源規劃的目的是優化企業數據管理的質量。這包括改善數據的享受,降低數據收集、管理和應用的成本,以及增強數據資源的價值。其中,首先要向不同層次的企業提供相關信息。對於決策者來說,提供的信息包括:有哪些數據資產,投資什麽,數據投資的效果如何,是否存在重復建設;對於管理層來說,提供的信息包括:數據保存在哪裏、誰在管理數據、誰在使用數據以及數據質量如何;對於執行層,提供的信息包括:有哪些數據可用,數據在哪裏,如何獲取數據,以及如何提交結果;對於信息服務部門來說,提供的信息包括:業務部門需要哪些數據以及如何使用這些數據。
數據資源規劃的目標是提出數據資源建設解決方案。通過實施方案,可以建立企業數據中心及其配套的建設和管理體系,達到數據資源規劃的目的。數據資源規劃的內容包括整理數據需求,即數據內容;設計數據相關標準,包括數據元標準、數據采集標準、數據管理標準、數據編碼標準等。設計數據建設和管理的技術方案;數據管理和服務的軟件體系結構;數據建設的組織結構和支撐體系。
數據資源規劃的過程如圖1所示。如果將數據中心的建設視為壹個完整的軟件工程項目,則數據資源規劃處於需求分析和概要設計階段。在項目實施過程中,需要根據規劃的方案進壹步進行詳細設計、系統開發、系統測試和運行維護。
在數據資源需求分析階段,通過調研梳理出當前綜合勘探開發研究的業務範圍、研究活動、已建立的數據庫和數據內容、應用軟件及部署等。根據來電情況建立業務模型,規範描述調研活動和各活動的數據需求,分析數據流向,形成統壹的數據資源目錄。需求分析階段的最終結果是需求分析報告,其核心內容由壹組規範組成,包括業務模型、數據資源目錄、數據元目錄和數據流規範。
概要設計階段的主要任務是根據數據需求進行方案設計,形成數據資源建設方案,包括:綜合數據庫建設方案、綜合研究數據服務與管理平臺建設方案、數據中心運維體系。形成數據模型、數據服務功能、數據管理功能、數據交換管理流程、數據管理與服務組織架構的總體框架,形成數據中心建設的項目框架。通過數據資源建設方案,明確了數據如何存儲、數據質量如何控制、數據如何建設、數據如何管理、數據如何獲取、提交和應用等問題。
圖1數據資源規劃流程
圖2數據資源規劃的結果及其關系
在項目實施階段,還需要根據數據資源建設計劃對每個項目進行詳細的設計和開發。
數據資源規劃成果包括數據資源需求分析報告和數據中心建設方案。需求分析報告包括業務模型、數據資源目錄和數據元目錄,數據中心建設方案包括包含數據庫和數據模型、數據服務和管理平臺、數據中心運維系統的數據庫建設方案。
圖2顯示了這些結果及其關系。業務模型中每個業務活動使用和生成的每種數據都應在數據資源目錄中註冊,數據資源目錄中的每種數據都應由壹個或多個數據元素描述。數據庫中的數據實例應分類到數據資源目錄中,並建立數據元素和數據模型之間的映射關系。根據上述關系,應用軟件或用戶可以根據業務活動使用數據服務和管理平臺輕松地從數據中心獲取所需的數據。
2基於6W的業務模式
業務模型是通過定義組成活動及其之間的邏輯關系來描述企業業務流程的模型。勘探開發業務建模是將石油勘探開發生命周期中涉及的業務抽象為完整的業務功能結構,建立勘探開發業務模型。建立這壹模型,不僅要從系統、本質和總體上把握勘探開發的功能結構,還要建立勘探開發行業的數據模型、知識模型和軟件模型等與功能相關的信息模型。
業務分析和建模的過程可以分為四個階段:壹是業務領域的劃分;二是按業務領域建模;三是商業模式整合;第四是商業模式的標準化。
商業模式采用“業務領域-業務分類-業務活動”三層結構。所有涉及石油勘探和開發的業務被劃分為多個業務領域,每個業務領域建立壹個多級業務分類,每個分類定義壹項或多項基本業務活動。
業務領域是企業中壹些主要業務活動領域的抽象,而不是現有機構和部門的副本。油田業務領域的劃分可以基於某個主題。業務領域的劃分原則是:(1)根據專業劃分業務領域;(二)按照油氣田勘探開發的生命周期劃分業務領域;(3)按照油氣田勘探開發管理階段劃分管理業務領域。業務領域的劃分應參照上述三個原則進行,盡量符合油氣田勘探開發管理的既定管理習慣,以確保不同業務領域的業務不重復,並能覆蓋所有勘探開發業務。根據上述原則,油氣勘探開發業務領域可劃分為物化探、井筒工程、分析測試、綜合研究、油氣生產和地面工程六大業務領域。
業務由壹系列業務活動組成,業務活動的描述按照“6W”模型進行【3】,即誰發起了活動,活動在何時、何地、為何進行,活動涉及哪些對象,這些對象的特征是什麽。業務活動中涉及的基本元素以及它們之間的關系由業務單元定義。壹個業務單元包括以下八類元素:1個業務活動、1個活動所作用的業務對象、實施活動的組織、1組結果對象(輸出)、1組參與對象(輸入)、業務規則、相關對象的特征以及對象之間的關系。業務部門的結構如圖3所示。
在業務單元中,“特征”定義了業務活動所需的數據以及與業務活動相關的知識,這是數據規劃的重點;“參與者”包括各種人員、軟件、數據、設施、材料和方法;“行動對象”包括區塊、油藏、井、層位、油田、企業等。“成果對象”可以是油井等油田實物,也可以是文件、方法、研究成果等技術對象。
基於6W的業務模型建模在統壹的業務領域分類框架下描述單個業務活動的業務單元,無需專門的業務流程梳理。但是,由於業務單元描述了業務活動參與對象和結果對象,即定義了活動的輸入和輸出,因此很容易自動形成業務流、數據流和知識流等各種流程。
業務活動和數據之間的關系可以用“CUR”矩陣來描述。在矩陣中,行對應於業務活動,列對應於數據元素。如果在業務活動中創建了某項數據,則該列的相應值標記為“c”(創建),如果業務活動更新了數據,則標記為“u”(更新),如果業務活動引用了某項數據,則標記為“r”(讀取)。CUR矩陣可用於檢查某壹數據是否具有唯壹的創建來源,並確保數據源的唯壹性。根據曲線關系,數據流可以自動形成。
圖3業務部門的結構
3勘探開發數據資源目錄
《勘探開發數據資源目錄》是對油田企業、勘探開發研究院或中國石化現有和所需數據的分類和組織的描述。數據資源目錄描述了企業需要什麽數據、擁有什麽數據、數據在哪裏、誰在管理數據、誰在使用數據以及哪個應用軟件在使用數據。數據資源目錄不僅是壹個數據建設單位的數據分類和數據組織標準,也是數據中心進行數據管理和服務平臺的核心元數據,也是用戶構建和使用數據的基礎。
數據資源目錄的分類模式是多維的,可以從不同的角度進行分類。常用的尺寸包括:
(1)按業務對象組織。包括區塊、油藏、井、層位、油田、企業等。,除了對象本身的基本數據(如井的基本信息),通常稱為靜態數據,還包括對象的各種動態數據(如井的日常數據)。
(2)由企業組織的活動。根據業務模型的“業務領域-業務分類-業務活動”三層結構,每個業務都有壹組由“CUR”標識的數據。
③按特點組織。根據數據或知識本身的特征進行分類,如長度、密度、滲透率等。
④按項目組織。項目使用和生成的數據是什麽?
⑤按單位組織。壹個部門使用、生成和管理哪些數據?
數據資源目錄的維度是相互關聯的,對象、活動、特征、項目和單元之間的關系如圖4所示。
除了建立分類目錄外,數據資源目錄還包括數據實例,因此需要將數據分類與數據庫中的實例相關聯,並清楚地識別每個類別包括哪些實例。將分類與實例關聯的方式主要由數據集定義,數據集中的實例由數據實例的標識符和標識條件確定【4】。數據資源的分類是在數據需求分析階段完成的,分類與數據實例之間的關聯是在數據中心運行過程中形成的。
數據資源目錄中的數據分為兩個層次:邏輯數據實體和屬性。從技術角度來看,邏輯數據實體的本質是數據視圖,數據視圖是壹個虛擬的數據表,每個數據視圖由多個屬性組成,至少包括壹個關鍵字。實體的屬性由數據元素描述。數據元素是不需要細分的基本數據單元【5】。目前可以直接查閱中國石化石油勘探開發數據元詞典【6】。
4數據中心的整體架構
不同企業數據中心的架構會有所不同【7】。本文以中國石油化工研究院石油勘探開發數據中心為例,闡述了數據中心的建設方案。數據中心包括綜合研究勘探開發數據庫、數據服務和管理平臺以及數據中心運維系統,如圖5所示。
圖4數據資源分類維度之間的關系
圖5用於綜合研究、勘探和開發的數據中心
勘探開發數據庫包括元數據和專業數據。元數據以數據資源目錄為基礎,描述了專業分類、目錄、結構、使用動態等信息。外包數據庫和地理信息數據庫來自外部,有成熟的管理軟件,屬於公共數據,獨立於具體項目研究。因為地震數據和測井數據有特殊的格式,它們由專門的軟件管理,但它們應該與項目數據相關。項目數據和成果主要以文件形式保存,* * *高享受的數據需要從半結構化文件形式轉換為結構化數據,數據之間相互關聯,實現數據集成。綜合研究應用軟件有自己的內部項目數據庫,通過數據橋技術可以實現在線數據訪問。數據通道用於實現石油勘探開發研究院數據中心與中國石化公司各級數據中心的互聯互通。
綜合研究數據服務與管理平臺的主要功能包括:GIS研究目標查詢、地震剖面顯示、測井曲線顯示、數據查詢、數據搜索、數據提交、數據下載、系統管理、數據發布等。
數據中心運維體系包括運維管理機構、數據報送管理和數據服務管理三個部分。運維管理團隊的職能包括數據庫系統管理、數據服務支持和數據質量控制。數據提交管理按照數據流程和數據生命周期對所有環節進行規範,包括:外部數據申請、數據采集、原始數據提交、個人/項目團隊數據管理、成果提交、數據流程調整(數據目錄註冊和註銷)、安全和權限、審核和驗收等。數據服務管理通過數據服務管理系統規範數據服務行為,建立數據服務技術規範,並通過數據應用服務接口規範為應用系統提供標準的服務接口。
5結論
數據資源規劃方法提出了壹套適用於石油勘探開發領域數據資源建設的方法論。從勘探開發業務需求出發,通過梳理業務流程建立業務模型,並對業務相關數據進行梳理,建立數據資源目錄。在此基礎上,提出已建成的數據中心建設方案,從人員組織、數據建設、服務平臺建設、運維管理等方面進行規劃。數據資源規劃方法成功應用於中國石化油氣勘探開發數據模型標準建設,開發了中國石化業務模型(SPBM),定義了物化探、井筒工程、分析測試、綜合研究開發生產、地面工程六大業務領域,包括65,438+0,237項業務活動,梳理了與業務活動相關的各項數據。下壹步研究工作將把數據資源規劃方法應用到中國石化石油勘探開發研究院的數據資源建設中,通過對研究院業務的研究,結合SPBM的情況,建立全面的研究數據資源目錄,設計數據中心建設方案。中國石化石油勘探開發研究院綜合研究數據資源規劃成果可進壹步推廣應用於石油行業石油公司綜合研究數據資源建設。
參考
陶金,鄭樹泉,李明民,等。企業架構驅動的IT規劃方法研究【J】。計算機應用與軟件,2009,26(12):164 ~ 166。
【2】高福賢。信息資源規劃-信息建設基礎設施【M】。北京清華大學出版社,2002。
肖波、景帥、武建軍和程潔。模型驅動技術在油田企業數據中心的應用研究【J】。大慶石油學院學報,2012,36(1):78 ~ 82。
史桂英、溫碧龍。基於數據元的數據集成技術研究【J】。科學技術與工程,2011,11(18):4223 ~ 4227。
【5】溫碧龍,張莉。使用語義樹【C】定義數據元素的語義。2008信息科學與工程國際研討會論文集,2008.12:524~527。
溫碧龍、肖波、陳新榮。石油勘探開發數據元數據管理技術【J】。大慶石油學院學報,2012,36(1):83 ~ 87。
、段。中國石化油田企業數據中心總體框架設計【J】。大慶石油學院學報,2012,36(1):73 ~ 76。