6日本語 EUC コード・ページ用の IBM コード化文字セット ID (CCSID) は、 6CCSID 954 として登録されています。 6CCSID 954 は、日本語の UNIX および Linux プラットフォームの共通のエンコード方式です。 6Microsoft ODBC アプリケーションを使って CCSID 954 の DB2 UDB データベースに接続すると、 6CCSID 954 から Unicode へのデータの変換時に問題が生じることがあります。 6問題が生じる可能性は、 6IBM のコード・ページの変換表と Microsoft のコード・ページの変換表の相違に起因します。 6IBM の変換表は日本工業規格 JISX0208、JISX0212、および JISX0221 に指定されている文字名に準拠しています。
6以下の文字は、CCSID 954 から Unicode に変換したときに、 6IBM または Microsoft のどちらの変換表を使用するかによって違ったコード・ポイントになります。
6
6表 3. CCSID 954 から Unicode コード・ポイントへの変換
| EUC-JP コード・ポイント (文字名) | IBM 基本コード・ポイント (Unicode 名) | Microsoft 基本コード・ポイント (Unicode 名) |
|---|---|---|
| X'A1BD' (ダッシュ (全角)) | U+2014 (ダッシュ (全角)) | U+2015 (Horizontal Bar) |
| X'A1C1' (波ダッシュ) | U+301C (波ダッシュ) | U+FF5E (Fullwidth Tilde) |
| X'A1C2' (双柱) | U+2016 (双柱) | U+2225 (Parallel To) |
| X'A1DD' (負符号) | U+2212 (負符号) | U+FF0D (Fullwidth hyphen-minus) |
| X'8FA2C3' (破断線) | U+00A6 (破断線) | U+FFE4 (Fullwidth broken bar) |
6たとえば、X'A1BD' の CCSID 954 コード・ポイントをもつ文字ダッシュ (全角) は、 6IBM 変換表を使用すると Unicdoe コード・ポイント U+2014 に変換されますが、 6Microsoft 変換表を使用すると U+2015 に変換されます。 6変換マッピングのこの相違のため、 6DB2 UDB Unicode データベースにおいてや、DB2 UDB 954 データベースの GRAPHIC 列においては、 6同一文字に対して 2 つの別々のコード・ポイントが充当されることがあります。 6すなわち、Microsoft ODBC アプリケーションは、 6U+2014 を無効コード・ポイントとして扱うことが原因の問題を生じる可能性があります。 6このような問題が起きないようにするために、デフォルトの IBM 変換表以外に、 6CCSID 954 から Unicode への代わりの Microsoft 変換表が DB2 UDB には用意されています。 6デフォルトの IBM 変換表を、代わりの Microsoft 変換表に置き換える必要があります。 6Unicode から CCSID 954 へのデフォルトの IBM 変換表は、Microsoft 版のものと一致することに注意してください。