2)建立數據模型和數據倉庫的物理設計。
3 .定義數據來源
4)選擇數據倉庫技術和平臺。
5)從操作數據庫中提取、凈化和轉換數據到數據倉庫。
6)選擇訪問和報告工具。
7)選擇數據庫連接軟件。
8)選擇數據分析和數據顯示軟件。
9)更新數據倉庫1)數據轉換工具應該能夠從各種數據源讀取數據。
2)支持平面文件、索引文件和傳統DBMS。
3)可以集成不同類型數據源的數據作為輸入。
4)擁有標準化的數據訪問接口。
5)最好能夠從數據字典中讀取數據。
6)工具生成的代碼必須在開發環境中具有可維護性。
7)只能提取滿足指定條件的數據和源數據的指定部分。
8)抽取時可以進行數據類型轉換和字符集轉換。
9)派生字段可以在提取期間計算和生成。
10)可以使數據倉庫管理系統自動調用以定期提取數據,或者可以將結果生成為平面文件。
11)必須仔細評估軟件供應商的活力和產品支持能力。
主要數據提取工具供應商:Prism Solutions。卡爾頓的護照。信息建築公司。
EDA/SQL.SASInstituteInc .壹般問題(不完全是技術或文化問題,但很重要)包括但不限於以下問題:
業務用戶希望執行哪種分析?
妳現在收集的數據需要支持這些分析嗎?
數據在哪裏?
數據有多幹凈?
相似數據是否有多個數據源?
什麽結構最適合核心數據倉庫(如維度或關系型)?
技術問題包括但不限於以下內容:
您需要在網絡中流通多少數據?能處理嗎?
需要多少硬盤空間?
硬盤存儲需要多快?
您將使用固態存儲還是虛擬存儲?