リリース情報

6コード化文字セット ID (CCSID) 954 用の代替 Unicode 変換表

6日本語 EUC コード・ページ用の IBM コード化文字セット ID (CCSID) は、 6CCSID 954 として登録されています。 6CCSID 954 は、日本語の UNIX および Linux プラットフォームの共通のエンコード方式です。 6Microsoft ODBC アプリケーションを使って CCSID 954 の DB2 UDB データベースに接続すると、 6CCSID 954 から Unicode へのデータの変換時に問題が生じることがあります。 6問題が生じる可能性は、 6IBM のコード・ページの変換表と Microsoft のコード・ページの変換表の相違に起因します。 6IBM の変換表は日本工業規格 JISX0208、JISX0212、および JISX0221 に指定されている文字名に準拠しています。

6以下の文字は、CCSID 954 から Unicode に変換したときに、 6IBM または Microsoft のどちらの変換表を使用するかによって違ったコード・ポイントになります。


6

6表 3. CCSID 954 から Unicode コード・ポイントへの変換

EUC-JP コード・ポイント (文字名) IBM 基本コード・ポイント (Unicode 名) Microsoft 基本コード・ポイント (Unicode 名)
X'A1BD' (ダッシュ (全角)) U+2014 (ダッシュ (全角)) U+2015 (Horizontal Bar)
X'A1C1' (波ダッシュ) U+301C (波ダッシュ) U+FF5E (Fullwidth Tilde)
X'A1C2' (双柱) U+2016 (双柱) U+2225 (Parallel To)
X'A1DD' (負符号) U+2212 (負符号) U+FF0D (Fullwidth hyphen-minus)
X'8FA2C3' (破断線) U+00A6 (破断線) U+FFE4 (Fullwidth broken bar)

6たとえば、X'A1BD' の CCSID 954 コード・ポイントをもつ文字ダッシュ (全角) は、 6IBM 変換表を使用すると Unicdoe コード・ポイント U+2014 に変換されますが、 6Microsoft 変換表を使用すると U+2015 に変換されます。 6変換マッピングのこの相違のため、 6DB2 UDB Unicode データベースにおいてや、DB2 UDB 954 データベースの GRAPHIC 列においては、 6同一文字に対して 2 つの別々のコード・ポイントが充当されることがあります。 6すなわち、Microsoft ODBC アプリケーションは、 6U+2014 を無効コード・ポイントとして扱うことが原因の問題を生じる可能性があります。 6このような問題が起きないようにするために、デフォルトの IBM 変換表以外に、 6CCSID 954 から Unicode への代わりの Microsoft 変換表が DB2 UDB には用意されています。 6デフォルトの IBM 変換表を、代わりの Microsoft 変換表に置き換える必要があります。 6Unicode から CCSID 954 へのデフォルトの IBM 変換表は、Microsoft 版のものと一致することに注意してください。


[ ページのトップ | 前ページ | 次ページ | 目次 ]