當前位置:成語大全網 - 新華字典 - 詳細介紹oracle數據庫字符集

詳細介紹oracle數據庫字符集

  壹 什麽是oracle字符集

 Oracle字符集是壹個字節數據的解釋的符號集合 有大小之分 有相互的包容關系 ORACLE 支持國家語言的體系結構允許妳使用本地化語言來存儲 處理 檢索數據 它使數據庫工具 錯誤消息 排序次序 日期 時間 貨幣 數字 和日歷自動適應本地化語言和平臺

 影響oracle數據庫字符集最重要的參數是NLS_LANG參數 它的格式如下:

  NLS_LANG = language_territory charset?

 它有三個組成部分(語言 地域和字符集) 每個成分控制了NLS子集的特性 其中:

 Language 指定服務器消息的語言 territory 指定服務器的日期和數字格式 charset 指定字符集 如:AMERICAN _ AMERICA ZHS GBK

 從NLS_LANG的組成我們可以看出 真正影響數據庫字符集的其實是第三部分 所以兩個數據庫之間的字符集只要第三部分壹樣就可以相互導入導出數據 前面影響的只是提示信息是中文還是英文

  二 如何查詢Oracle的字符集

 很多人都碰到過因為字符集不同而使數據導入失敗的情況 這涉及三方面的字符集 壹是oracel server端的字符集 二是oracle client端的字符集;三是dmp文件的字符集 在做數據導入的時候 需要這三個字符集都壹致才能正確導入

  查詢oracle server端的字符集

 有很多種方法可以查出oracle server端的字符集 比較直觀的查詢方法是以下這種:SQL>select userenv( language ) from dual;

 結果類似如下:AMERICAN _ AMERICA ZHS GBK

  如何查詢dmp文件的字符集

 用oracle的exp工具導出的dmp文件也包含了字符集信息 dmp文件的第 和第 個字節記錄了dmp文件的字符集 如果dmp文件不大 比如只有幾M或幾十M 可以用UltraEdit打開( 進制方式) 看第 第 個字節的內容 如 然後用以下SQL查出它對應的字符集:

 

 SQL> select nls_charset_name(to_number( xxxx )) from dual;?

 ZHS GBK

 如果dmp文件很大 比如有 G以上(這也是最常見的情況) 用文本編輯器打開很慢或者完全打不開 可以用以下命令(在unix主機上):

  cat exp dmp |od x|head |awk {print $ $ } |cut c

 然後用上述SQL也可以得到它對應的字符集

  查詢oracle client端的字符集

 這個比較簡單 在windows平臺下 就是註冊表裏面相應OracleHome的NLS_LANG 還可以在dos窗口裏面自己設置 比如:

  set nls_lang=AMERICAN_AMERICA ZHS GBK?

 這樣就只影響這個窗口裏面的環境變量

 在unix平臺下 就是環境變量NLS_LANG

 $echo $NLS_LANG

 AMERICAN_AMERICA ZHS GBK

 如果檢查的結果發現server端與client端字符集不壹致 請統壹修改為同server端相同的字符集

  三 修改oracle的字符集

 上文說過 oracle的字符集有互相的包容關系 如us ascii就是zhs gbk的子集 從us ascii到zhs gbk不會有數據解釋上的問題 不會有數據丟失 在所有的字符集中utf 應該是最大 因為它基於unicode 雙字節保存字符(也因此在存儲空間上占用更多)

 壹旦數據庫創建後 數據庫的字符集理論上講是不能改變的 因此 在設計和安裝之初考慮使用哪壹種字符集十分重要 根據Oracle的官方說明 字符集的轉換是從子集到超集受支持 反之不行 如果兩種字符集之間根本沒有子集和超集的關系 那麽字符集的轉換是不受oracle支持的 對數據庫server而言 錯誤的修改字符集將會導致很多不可測的後果 可能會嚴重影響數據庫的正常運行 所以在修改之前壹定要確認兩種字符集是否存在子集和超集的關系 壹般來說 除非萬不得已 我們不建議修改oracle數據庫server端的字符集 特別說明 我們最常用的兩種字符集ZHS GBK和ZHS CGB 之間不存在子集和超集關系 因此理論上講這兩種字符集之間的相互轉換不受支持

  修改server端字符集(不建議使用)

 在oracle 之前 可以用直接修改數據字典表props$來改變數據庫的字符集 但oracle 之後 至少有三張系統表記錄了數據庫字符集的信息 只改props$表並不完全 可能引起嚴重的後果 正確的修改方法如下:

 

 $sqlplus /nolog

 SQL>conn / as sysdba;?

 若此時數據庫服務器已啟動 則先執行SHUTDOWN IMMEDIATE命令關閉數據庫服務器 然後執行以下命令:

 

 SQL>STARTUP MOUNT;

 SQL>ALTER SYSTEM ENABLE RESTRICTED SESSION;

 SQL>ALTER SYSTEM SET JOB_QUEUE_PROCESSES= ;

 SQL>ALTER SYSTEM SET AQ_TM_PROCESSES= ;

 SQL>ALTER DATABASE OPEN;

 SQL>ALTER DATABASE CHARACTER SET ZHS GBK;

 SQL>ALTER DATABASE national CHARACTER SET ZHS GBK;

 SQL>SHUTDOWN IMMEDIATE;

 SQL>STARTUP?

  修改dmp文件字符集

 上文說過 dmp文件的第 第 字節記錄了字符集信息 因此直接修改dmp文件的第 第 字節的內容就可以 騙 過oracle的檢查 這樣做理論上也僅是從子集到超集可以修改 但很多情況下在沒有子集和超集關系的情況下也可以修改 我們常用的壹些字符集 如US ASCII WE ISO P ZHS CGB ZHS GBK基本都可以改 因為改的只是dmp文件 所以影響不大

 具體的修改方法比較多 最簡單的就是直接用UltraEdit修改dmp文件的第 和第 個字節 比如想將dmp文件的字符集改為ZHS GBK 可以用以下SQL查出該種字符集對應的 進制代碼:

 

 SQL> select to_char(nls_charset_id( ZHS GBK ) xxxx ) from dual;

  ?

 然後將dmp文件的 字節修改為 即可

lishixinzhi/Article/program/Oracle/201311/17875