发行说明

6编码字符集标识(CCSID)954 的备用 Unicode 转换表

6日语 EUC 代码页的 IBM 编码字符集标识(CCSID)被注册为 6CCSID 954。CCSID 954 是日语 UNIX 和 Linux 平台的公共编码。当使用 6Microsoft ODBC 应用程序来连接至 CCSID 为 954 的 DB2 UDB 数据库时,在将数据从 6CCSID 954 转换为 Unicode 时会遇到潜在问题。潜在问题是由于 6IBM 的代码页转换表与 Microsoft 的代码页转换表之间的差异造成的。IBM 转换表遵守在“日本工业标准”(JIS)JISX0208、JISX0212 和 6JISX0221 中指定的字符名称。

6当从 CCSID 954 转换为 Unicode 时,根据使用的是 IBM 转换表还是 Microsoft 转换表,下列字符将产生不同的代码点。
6

6表 3. CCSID 954 至 Unicode 代码点转换

EUC-JP 代码点(字符名称) IBM 主要代码点(Unicode 名称) Microsoft 主要代码点(Unicode 名称)
X'A1BD'(长破折号) U+2014(长破折号) U+2015(横杠)
X'A1C1'(波浪号) U+301C(波浪号) U+FF5E(全角代字号)
X'A1C2'(双竖线) U+2016(双竖线) U+2225(平行线)
X'A1DD'(减号) U+2212(减号) U+FF0D(全角减号短划)
X'8FA2C3'(短划线) U+00A6(短划线) U+FFE4(全角短划线)

6例如,当使用 IBM 转换表时,CCSID 954 代码点为 X'A1BD' 的长破折号字符被转换为 6Unicode 代码点 U+2014,但当使用 Microsoft 转换表时,却被转换为 U+2015。由于转换映射的这种差异,对于 6DB2 UDB Unicode 数据库或 DB2 UDB 954 数据库的图形列中的同一个字符可能具有两个不同的代码点。这对于 6Microsoft ODBC 应用程序可能会产生潜在问题,因为这些应用程序会认为 6U+2014 是无效的代码点。为了避免这些潜在问题,除了缺省 IBM 转换表之外,DB2 UDB 还提供了从 6CCSID 954 转换为 Unicode 的备用 Microsoft 转换表。需要用该备用 6Microsoft 转换表替换缺省 IBM 转换表。注意,从 Unicode 至 CCSID 954 6的缺省 IBM 转换表要与 Microsoft 版本相匹配。


[ 页的顶部 | 上一页 | 下一页 | 目录 ]