版本注意事項

6編碼字集識別碼 (CCSID) 954 的替代 Unicode 轉換表

6日文 EUC 字碼頁的 IBM 編碼字集識別碼 (CCSID) 已登錄為 CCSID 954。 CCSID 954 6是日文 UNIX 及 Linux 平台常用的編碼。 使用 Microsoft ODBC 應用程式連接至 CCSID 6954 的 DB2 UDB 資料庫時, 您可能在將資料從 CCSID 954 轉換為 Unicode 6時遇到潛伏的問題。 發生潛伏的問題是因為 IBM 的字碼頁轉換表與 Microsoft 6的字碼頁轉換表之間有差異。 IBM 轉換表符合「日本工業標準 6(JIS)」JISX0208、JISX0212 及 JISX0221 中指定的字元名稱。

6從 CCSID 954 轉換為 Unicode 時,下列字元將造成不同的字碼點, 取決於使用 IBM 6或 Microsoft 轉換表而定。
6

6表 3. CCSID 954 至 Unicode 字碼點轉換

EUC-JP 字碼點 (字元名稱) IBM 主要字碼點 (Unicode 名稱) Microsoft 主要字碼點 (Unicode 名稱)
X'A1BD' (EM 破折號) U+2014 (EM 破折號) U+2015 (水平列)
X'A1C1' (波狀破折號) U+301C (波狀破折號) U+FF5E (完整寬度的 ~ 字元)
X'A1C2' (雙垂直線) U+2016 (雙垂直線) U+2225 (並行)
X'A1DD' (減號) U+2212 (減號) U+FF0D (完整寬度的連字號-減號)
X'8FA2C3' (分列) U+00A6 (分列) U+FFE4 (完整寬度的分列)

6例如,當使用 IBM 轉換表時,具有 CCSID 954 字碼點 X'A1BD' 的字元 EM 6破折號會轉換為 Unicode 字碼點 U+2014, 但是在使用 Microsoft 6轉換表時,則會轉換為 U+2015。 因為轉換對映的這個差異,所以您可能在 DB2 UDB 6Unicode 資料庫, 或在 DB2 UDB 954 6資料庫的圖形直欄,對相同字元具有兩個不同的字碼點。這可能會對 Microsoft ODBC 6應用程式產生潛伏的問題,因為它們會將 U+2014 視為無效的字碼點。 6為了避免這些潛伏的問題,除了預設 IBM 轉換表之外, DB2 UDB 還會提供從 CCSID 954 6至 Unicode 的替代 Microsoft 轉換表。 您需要將預設 IBM 轉換表換成替代的 6Microsoft 轉換表。 請注意,從 Unicode 至 CCSID 954 的預設 IBM 轉換表符合 6Microsoft 版本。


[ 頁面頂端 | 前一頁 | 下一頁 | 目錄 ]