當前位置:成語大全網 - 書法字典 - 如何設計和創建面向CRM的數據倉庫?

如何設計和創建面向CRM的數據倉庫?

1 CRM系統

1.1客戶關系管理簡介

壹個完整的CRM可以分為三個部分:運營型CRM、協作型CRM和分析型CRM。運營型CRM是CRM中最基礎的功能系統,提供整個CRM流程管理功能,主要提供營銷、銷售、服務、支持等以客戶為中心的業務流程的自動化。協同CRM以客戶服務中心為主要形式,以計算機電話集成為核心,使客戶能夠通過電話、傳真、電子郵件和網站更快、更有效地與企業進行交互。

分析型CRM是通過整合運營型CRM、協作型CRM、其他企業應用系統和外部數據源中存儲的客戶相關數據,構建以客戶為中心的數據倉庫,獲得企業內部客戶數據的壹致視圖。它以整合的客戶數據為基礎,通過查詢和報表分析、OLAP分析、數據挖掘等手段獲取關於客戶的知識,從而為客戶提供個性化的產品和服務,提高客戶滿意度和忠誠度,實現客戶終身價值最大化。本文主要針對分析型CRM。

1.2在CRM中應用數據倉庫的必要性

數據倉庫是CRM的中心環節,甚至是CRM的靈魂。它存儲了企業內外的各種數據,並將這些源數據組織成壹個隨時間變化的壹致的客戶信息庫,最大限度地優化分析。通過OLAF分析和數據挖掘,可以發現大量客戶信息中的隱藏規則,為企業進行經營決策提供支持。另壹方面,它有效地將CRM的業務平臺與分析平臺分離,使業務數據庫可以專註於事務處理,不僅提高了事務處理的效率,還優化了分析處理的能力。

在傳統的企業事務處理系統部門中,每個部門根據自己的事務處理需要保留壹部分數據,各個模塊之間的關系並不緊密。雖然也可以從這些系統中獲取客戶的壹些信息,但遠遠不能滿足需求。例如,針對客戶行為的典型分析,通常需要更多反映歷史變化的每日累積數據才能進行有效分析。而傳統的教學數據庫系統很難做到這壹點(無論是從數據存儲還是數據集成的角度)。因此,數據倉庫的引入是必然的。

1.3分析型CRM的架構

將數據倉庫技術引入到客戶信息的管理和組織中,即建立壹個面向CRM應用系統的客戶信息數據挖掘倉庫,實現來自企業內外各種分割應用的客戶信息的集成和統壹,這是分析型CRM的基本任務。如圖1,是分析型CRM的架構。其中,客戶信息數據倉庫是分析型CRM的核心,其任務主要是從OLTP系統中提取數據,將提取的數據轉換成統壹的格式,加載到數據倉庫環境中(以上三個步驟稱為ETL,即提取、轉換、加載、提取、轉換、加載),並對數據倉庫中的數據進行管理和維護。最後,通過對這些數據進行OLAP分析和數據挖掘,企業管理者可以獲得很多有價值的信息,從而更好地為客戶服務。

在構建數據倉庫時,這裏采用可擴展的數據倉庫架構,即中間層包括兩類數據庫:壹類是包含多個主題的基礎數據倉庫;特定主題的另壹種從屬數據集市。如圖1所示,根據數據倉庫中的四個主題設計了4000個數據集市。采用可擴展架構可以縮短數據倉庫的建設周期,降低費用,避免了直接建立數據集市而不建立數據倉庫,可擴展性差,多個教材交易會之間難以保持同步的問題。

2客戶信息數據倉庫的設計

設計客戶信息數據倉庫的第壹步是建立主題。主題是壹個抽象的概念,是在更高層次上對企業信息系統中的數據進行綜合、分類和分析的對象。數據倉庫的設計應從運行環境中的數據入手,根據決策支持的實際需要確定數據倉庫的主題。根據分析型CRM的功能,客戶信息數據倉庫包括四個主題:客戶開發、客戶購買、產品和營銷。其中,客戶購買主題主要從不同角度分析客戶的購買行為,如客戶的購買行為與客戶背景信息的關系,主要包括客戶的受教育程度、收入水平、年齡、性別、是否已婚等。在客戶信息數據倉庫模型中,設計分為三步,重頭戲是概念模型、邏輯模型和物理模型設計。針對網上書店,以客戶購買主題為例,給出了完整的客戶信息數據倉庫模型設計方案。

2.1概念模型設計

數據倉庫設計中概念模型設計的目的是確定面向主題的信息包絡。信息包圖作為壹種通用的、壹致的、緊湊的概念模型設計工具,能夠清晰地反映用戶的需求以及實現這種需求所需的各種要素及其關系。包圖由名稱、維度、類別和度量組成,其中類別表示維度的層次結構。

網上書店客戶信息數據倉庫中客戶購買的主題信息包示意圖如圖2所示。其中,圖書的分類方式有三種,前兩種比較常見,另壹種是根據圖書的存在形式進行分類,分為普通圖書、Vbook和Ebook。普通圖書是傳統的紙質圖書,電子書是指基於計算機和網絡的電子圖書,Vbook是多媒體演示、培訓和商務交流的新型載體,具有音視頻功能,如各領域專家講座、教學和考試培訓班等。隨著計算機的普及和網絡的發展,電子書和Vbook越來越受到讀者的青睞。

2.2邏輯模型設計

數據倉庫的邏輯模型壹般包括星型模型和雪花型模型。星型模型是基於關系數據庫的面向OLAP的多維數據模型的數據組織形式。它由事實表和多個維度表組成。通過使用包括主題的事實表和包含事實的不規則描述的多維表來執行決策支持查詢,查詢性能高於高度標準化的設計結構。

雖然雪花模型比星型模型更符合標準化的設計結構,但它增加了查詢的復雜性,降低了查詢的性能。因此,這裏采用的是星型模型。

星型模型的建立應以概念模型中的包圈為基礎,將包圖轉化為星型模型。具體方法如下:將包圖中的度量實體放在星型模型的中心,將包圖中的維度實體放在度量實體的外圍。客戶信息數據倉庫中客戶購買主題的邏輯模型。

2.3物理模型設計

物理模型是教材在數據倉庫中的存儲形式和組織形式。設計壹個物理模型,要在星型模型或雪花型模型的基礎上確定事實表和維度表的結構;明確兩者的數據字段、數據類型、關聯字段和索引結構;確定多維數據集在數據倉庫中的存儲結構,如物理訪問方式、數據存儲結構、數據存儲位置以及存儲分配是否分區。在設計物理模型時,應該考慮I/O訪問時間、空間利用率和維護成本。

目前大多數數據倉庫都是基於關系數據庫的,基礎數據和最終數據的存儲都是由數據庫系統管理的。在該數據倉庫的設計中,選擇MSSQLServer2000及其組件分析服務器作為數據庫和數據倉庫的管理系統。在邏輯上,數據倉庫是多維的,但在物理存儲上,其多維數據集的存儲方式有三種:關系聯機分析處理(ROLAP)、多維聯機分析處理(MOLAP)和混合聯機分析處理(HOLAP)。

在這個數據倉庫中,多維數據集的存儲方式是HOLAP,即基礎數據保存在原來的關系數據庫中,而聚集存儲在分析服務器上的多維結構中。這不僅可以避免數據重復,還可以提高查詢性能(因為聚集存儲在多維數據集中),只有在頻繁訪問詳細數據時,才會對性能產生很大影響。

3現實

對於網上書店,這個數據倉庫的實現是基於MSSQLServer2000平臺的。通過SQLServer中的DTS服務和VBScript實現了將源數據導入數據倉庫的ETL過程。通過AnalysisServices建立多維數據集,實現OLAP操作,並支持多維表達式(MDX)查詢。通過自動構造MDX語句,實現了滾動、鉆取、切片、劃片、旋轉等OLAP操作。

客戶信息數據倉庫* * *包含四個主題:客戶開發、客戶購買、產品和營銷,以及客戶購買主題的OLAP分析示例。其中,用戶可以從客戶所在地、年齡、性別、婚姻狀況、職業、年收入、會員星級、按內容進行圖書I分類、按出版社進行圖書I分類、按現有形式和時間進行圖書I分類***11五個維度分析客戶購買數量、金額、成本、利潤、平均單價五個衡量指標。

此外,通過使用AnalysisServices提供的數據透視表服務,用戶可以用VB或其他語言開發自己的前端數據展現程序,也可以直接使用現有工具,如MSOffice套件中的Excel和Access,實現多維數據集的數據展現功能,從而方便地得到各種統計報表和分析圖表。用Excel展示2005年不同年齡段顧客購買不同種類圖書的利潤分析。