Uwagi do wydania

6Alternatywne tabele konwersji formatu Unicode dla identyfikatora kodowanego zestawu znaków (CCSID) 954

6Identyfikator kodowanego zestawu znaków (CCSID) firmy IBM dla japońskiej 6strony kodowej EUC jest rejestrowany przy użyciu identyfikatora CCSID 6954. Identyfikator CCSID 954 określa powszechnie używane kodowanie dla 6japońskich wersji platform UNIX i Linux. Gdy do nawiązania połączenia z 6bazą danych programu DB2 UDB o identyfikatorze CCSID 954 używane są aplikacje 6wykorzystujące technologię Microsoft ODBC, mogą wystąpić problemy związane z 6konwersją danych zestawu znaków o identyfikatorze CCSID 954 na format 6Unicode. Problemy te wynikają z różnic między tabelami konwersji stron 6kodowych firm IBM i Microsoft.Tabela konwersji firmy IBM jest zgodna z 6nazwami znaków zdefiniowanymi przez standardy JIS (Japanese Industry Standard) 6JISX0208, JISX0212 oraz JISX0221.

6Poniżej przedstawiono listę znaków, których punkty kodowe uzyskane w wyniku 6konwersji z formatu CCSID 954 na format Unicode przy użyciu tabeli konwersji 6firmy IBM i tabeli konwersji firmy Microsoft będą różne.
6

6Tabela 3. Konwersja punktów kodowych z formatu CCSID 954 na format Unicode

Punkt kodowy w standardzie EUC-JP (nazwa znaku) Pierwotny punkt kodowy używany przez firmę IBM (nazwa znaku w formacie Unicode) Pierwotny punkt kodowy używany przez firmę Microsoft (nazwa znaku w formacie Unicode)
X'A1BD' (myślnik) U+2014 (myślnik) U+2015 (kreska pozioma)
X'A1C1' (znak wartości przybliżonej) U+301C (znak wartości przybliżonej) U+FF5E (tylda pełnej długości)
X'A1C2' (podwójna pionowa kreska) U+2016 (podwójna pionowa kreska) U+2225 (znak równoległości)
X'A1DD' (minus) U+2212 (minus) U+FF0D (łącznik pełnej długości)
X'8FA2C3' (kreska przerywana) U+00A6 (kreska przerywana) U+FFE4 (kreska przerywana pełnej długości)

6Na przykład gdy używana jest tabela konwersji firmy IBM, znak myślnika o 6identyfikatorze CCSID 954 punktu kodowego X'A1BD' jest przekształcany 6na punkt kodowy Unicode U+2014, a gdy używana jest tabela konwersji firmy 6Microsoft, znak ten jest przekształcany na punkt kodowy U+2015. Z 6powodu tej różnicy odwzorowań konwersji w pojedynczej bazie danych DB2 UDB w 6formacie Unicode lub w kolumnie graficznej bazy danych DB2 UDB 954 dla 6pojedynczego znaku mogą występować dwa różne punkty kodowe. Może to być 6przyczyną problemów dla aplikacji wykorzystujących technologię Microsoft ODBC, 6ponieważ aplikacje te mogą traktować znak U+2014 jako niepoprawny punkt 6kodowy. Aby można było uniknąć tego problemu, w programie DB2 UDB 6oprócz domyślnej tabeli konwersji firmy IBM dostępna jest alternatywna tabela 6konwersji firmy Microsoft służąca do wykonywania konwersji strony kodowej 6CCSID 954 na format Unicode. Aby użyć alternatywnej tabeli firmy 6Microsoft, należy zastąpić nią domyślną tabelę konwersji firmy IBM. 6Należy zauważyć, że domyślna tabela konwersji firmy IBM służąca do 6przekształcania znaków w formacie Unicode na znaki strony kodowej CCSID 954 6jest zgodna z odpowiednią tabelą konwersji firmy Microsoft.


[ Początek strony | Poprzednia strona | Następna strona | Spis treści ]