自從二十世紀五十年代後期計算機的首次使用以來,數據和信息的世界壹直在不斷的發展。隨著時間的過去,很明顯數據像許多實體壹樣都有生命周期,並且特定於生命周期中的每個時點、不同的壹組特征、存儲和訪問需求。數據倉庫的概念由業務需求演變而來,業務需要在不同數據源之間基於其生命周期內的不同點進行可靠、統壹和集成的數據報告和分析。
就總的感覺而言,數據倉庫只是組織以電子方式存儲數據的壹個資料庫;重要的是必須意識到,任何倉庫都會受限於在倉庫中查找和訪問項目以及將項目移入和移出倉庫的流程。對於數據而言,數據倉庫系統的主要組成部分包括有選擇地存儲數據的能力、檢索和分析數據的能力(不管數據在哪裏),以及管理數據字典的能力。為了有效操作數據倉庫,組織需要了解數據倉庫中存儲的信息在數據生命周期內的不同點存在的固有差異。
隨著數據變舊:
1. 訪問數據的可能性會降低。簡言之,數據變得越舊,它的使用頻率就越低。
2. 數據結構會改變。隨著軟件逐漸發展得更加復雜以更有效率地處理更多數據,數據庫體系架構必然也要改變。透過壹系列利用越來越強大的硬件和軟件技術的軟件版本穩定發布可看到這壹點。
3. 存儲的數據量呈指數方式增長。受行業及政府法規的制約,數據必須存儲和保持可訪問數年之久。然後只有第壹年的數據價值被有效利用,維護歷史數據可能輕易地讓數據存儲激增到比當前生產數據庫多20倍。
實施強大存檔技術將為數據倉庫提供最佳的和經濟高效的存檔基礎設施:
1. 在多種格式之間保持數據完整性
2. 實現方便的按需訪問存檔數據
3. 提供通用連接,並與多種存檔平臺集成以確保卓越和經濟高效的可擴展性和性能
4. 高效存儲存檔數據以節約存儲容量,同時促進快速檢索數據