當前位置:成語大全網 - 新華字典 - oracle壹張上千萬記錄的數據表需要改為分區表,用什麽方法好?

oracle壹張上千萬記錄的數據表需要改為分區表,用什麽方法好?

Oracle提供了分區技術以支持VLDB(Very Large DataBase)。分區表通過對分區列的判斷,把分區列不同的記錄,放到不同的分區中。分區完全對應用透明。

Oracle的分區表可以包括多個分區,每個分區都是壹個獨立的段(SEGMENT),可以存放到不同的表空間中。查詢時可以通過查詢表來訪問各個分區中的數據,也可以通過在查詢時直接指定分區的方法來進行查詢。

分區提供以下優點:

由於將數據分散到各個分區中,減少了數據損壞的可能性;

可以對單獨的分區進行備份和恢復;

可以將分區映射到不同的物理磁盤上,來分散IO;

提高可管理性、可用性和性能。

Oracle提供了以下幾種分區類型:

範圍分區(range);

哈希分區(hash);

列表分區(list);

範圍-哈希復合分區(range-hash);

範圍-列表復合分區(range-list)。

Oracle的普通表沒有辦法通過修改屬性的方式直接轉化為分區表,必須通過重建的方式進行轉變,下面介紹三種效率比較高的方法,並說明它們各自的特點。

方法壹:利用原表重建分區表。

步驟:

SQL> CREATE TABLE T (ID NUMBER PRIMARY KEY, TIME DATE);

表已創建。

SQL> INSERT INTO T SELECT ROWNUM, CREATED FROM DBA_OBJECTS;

已創建6264行。

SQL> COMMIT;

提交完成。

SQL> CREATE TABLE T_NEW (ID, TIME) PARTITION BY RANGE (TIME)

2 (PARTITION P1 VALUES LESS THAN (TO_DATE('2004-7-1', 'YYYY-MM-DD')),

3 PARTITION P2 VALUES LESS THAN (TO_DATE('2005-1-1', 'YYYY-MM-DD')),

4 PARTITION P3 VALUES LESS THAN (TO_DATE('2005-7-1', 'YYYY-MM-DD')),

5 PARTITION P4 VALUES LESS THAN (MAXVALUE))

6 AS SELECT ID, TIME FROM T;

表已創建。

SQL> RENAME T TO T_OLD;

表已重命名。

SQL> RENAME T_NEW TO T;

表已重命名。

SQL> SELECT COUNT(*) FROM T;

COUNT(*)

----------

6264

SQL> SELECT COUNT(*) FROM T PARTITION (P1);

COUNT(*)

----------

0

SQL> SELECT COUNT(*) FROM T PARTITION (P2);

COUNT(*)

----------

6246

SQL> SELECT COUNT(*) FROM T PARTITION (P3);

COUNT(*)

----------

18

優點:方法簡單易用,由於采用DDL語句,不會產生UNDO,且只產生少量REDO,效率相對較高,而且建表完成後數據已經在分布到各個分區中了。

不足:對於數據的壹致性方面還需要額外的考慮。由於幾乎沒有辦法通過手工鎖定T表的方式保證壹致性,在執行CREATE TABLE語句和RENAME T_NEW TO T語句直接的修改可能會丟失,如果要保證壹致性,需要在執行完語句後對數據進行檢查,而這個代價是比較大的。另外在執行兩個RENAME語句之間執行的對T的訪問會失敗。

適用於修改不頻繁的表,在閑時進行操作,表的數據量不宜太大。

方法二:使用交換分區的方法。

步驟:

SQL> CREATE TABLE T (ID NUMBER PRIMARY KEY, TIME DATE);

表已創建。

SQL> INSERT INTO T SELECT ROWNUM, CREATED FROM DBA_OBJECTS;

已創建6264行。

SQL> COMMIT;

提交完成。

SQL> CREATE TABLE T_NEW (ID NUMBER PRIMARY KEY, TIME DATE) PARTITION BY RANGE (TIME)

2 (PARTITION P1 VALUES LESS THAN (TO_DATE('2005-7-1', 'YYYY-MM-DD')),

3 PARTITION P2 VALUES LESS THAN (MAXVALUE));

表已創建。

SQL> ALTER TABLE T_NEW EXCHANGE PARTITION P1 WITH TABLE T;

表已更改。

SQL> RENAME T TO T_OLD;

表已重命名。

SQL> RENAME T_NEW TO T;

表已重命名。

SQL> SELECT COUNT(*) FROM T;

COUNT(*)

----------

6264

優點:只是對數據字典中分區和表的定義進行了修改,沒有數據的修改或復制,效率最高。如果對數據在分區中的分布沒有進壹步要求的話,實現比較簡單。在執行完RENAME操作後,可以檢查T_OLD中是否存在數據,如果存在的話,直接將這些數據插入到T中,可以保證對T插入的操作不會丟失。

不足:仍然存在壹致性問題,交換分區之後RENAME T_NEW TO T之前,查詢、更新和刪除會出現錯誤或訪問不到數據。如果要求數據分布到多個分區中,則需要進行分區的SPLIT操作,會增加操作的復雜度,效率也會降低。

適用於包含大數據量的表轉到分區表中的壹個分區的操作。應盡量在閑時進行操作。

方法三:Oracle9i以上版本,利用在線重定義功能

步驟:

SQL> CREATE TABLE T (ID NUMBER PRIMARY KEY, TIME DATE);

表已創建。

SQL> INSERT INTO T SELECT ROWNUM, CREATED FROM DBA_OBJECTS;

已創建6264行。

SQL> COMMIT;

提交完成。

SQL> EXEC DBMS_REDEFINITION.CAN_REDEF_TABLE(USER, 'T', DBMS_REDEFINITION.CONS_USE_PK);

PL/SQL 過程已成功完成。

SQL> CREATE TABLE T_NEW (ID NUMBER PRIMARY KEY, TIME DATE) PARTITION BY RANGE (TIME)

2 (PARTITION P1 VALUES LESS THAN (TO_DATE('2004-7-1', 'YYYY-MM-DD')),

3 PARTITION P2 VALUES LESS THAN (TO_DATE('2005-1-1', 'YYYY-MM-DD')),

4 PARTITION P3 VALUES LESS THAN (TO_DATE('2005-7-1', 'YYYY-MM-DD')),

5 PARTITION P4 VALUES LESS THAN (MAXVALUE));

表已創建。

SQL> EXEC DBMS_REDEFINITION.START_REDEF_TABLE(USER, 'T', 'T_NEW', -

> 'ID ID, TIME TIME', DBMS_REDEFINITION.CONS_USE_PK);

PL/SQL 過程已成功完成。

SQL> EXEC DBMS_REDEFINITION.FINISH_REDEF_TABLE('YANGTK', 'T', 'T_NEW');

PL/SQL 過程已成功完成。

SQL> SELECT COUNT(*) FROM T;

COUNT(*)

----------

6264

SQL> SELECT COUNT(*) FROM T PARTITION (P2);

COUNT(*)

----------

6246

SQL> SELECT COUNT(*) FROM T PARTITION (P3);

COUNT(*)

----------

18

優點:保證數據的壹致性,在大部分時間內,表T都可以正常進行DML操作。只在切換的瞬間鎖表,具有很高的可用性。這種方法具有很強的靈活性,對各種不同的需要都能滿足。而且,可以在切換前進行相應的授權並建立各種約束,可以做到切換完成後不再需要任何額外的管理操作。

不足:實現上比上面兩種略顯復雜。

適用於各種情況。

這裏只給出了在線重定義表的壹個最簡單的例子,詳細的描述和例子可以參考下面兩篇文章。

Oracle的在線重定義表功能:/post/468/12855

Oracle的在線重定義表功能(二):/post/468/12962

索引也可以進行分區,分區索引有兩種類型:global和local。對於local索引,每壹個表分區對應壹個索引分區,當表的分區發生變化時,索引的維護由Oracle自動進行。對於global索引,可以選擇是否分區,而且索引的分區可以不與表分區相對應。當對分區進行維護操作時,通常會導致全局索引的INVALDED,必須在執行完操作後REBUILD。Oracle9i提供了UPDATE GLOBAL INDEXES語句,可以使在進行分區維護的同時重建全局索引。

全局索引可以包含多個分區的值 局部索引比全局索引容易管理,而全局索引比較快

註意:不能為散列分區 或者 子分區創建全局索引

Oracle的分區功能十分強大。不過用起來發現有兩點不大方便:

第壹是已經存在的表沒有方法可以直接轉化為分區表。不過Oracle提供了在線重定義表的功能,可以通過這種方式來完成普通表到分區表的轉化。可以參考這個例子:/post/468/13091

第二點是如果采用了local分區索引,那麽在增加表分區的時候,索引分區的表空間是不可控制的。如果希望將表和索引的分區分開到不同的表空間且不同索引分區也分散到不同的表空間中,那麽只能在增加分區後,對新增的分區索引單獨rebuild。

Oracle最大允許存在多少個分區呢?

我們可以從Oracle的Concepts手冊上找到這個信息,對於Oracle9iR2:

Tables can be partitioned into up to 64,000 separate partitions.

對於Oracle10gR2,Oracle增強了分區特性:

Tables can be partitioned into up to 1024K-1 separate partitions.

關於何時應該進行分區,Oracle有如下建議:

■ Tables greater than 2GB should always be considered for partitioning.

■ Tables containing historical data, in which new data is added into the newest partition. A typical example is a historical table where only the current month's data is updatable and the other 11 months are read only.

這些信息是在網上查到的,測試了下確實可以用。