ILE COBOL 解説書

XML 文書のためのコード化文字セット

XML PARSE は、国別データ項目、英数字データ項目、および UCS-2 および 1 バイト CCSID を持つ IFS ファイルの XML 文書をサポートしています。国別データ項目の文書は、Unicode UCS-2、CCSID 13488 を使用 してエン コードされなければなりません。英数字データ項目の文書は、XML 文書のための「XML 文 書でサポートされている EBCDIC CCSID」 (表 34) で示されている単一バ イトの EBCDIC CCSID で明示的にサポートされているものの 1 つ、 または「XML 文書でサポートされている ASCII CCSID」(表 35) で 示されている ASCII CCSID のうち 1 つを使用して、エンコードされなければなりません。


表 34. XML 文書でサポートされている EBCDIC CCSID

CCSID 内容
1140、37 米国、カナダなど。ユーロ国別拡張 CCSID (ECECP)、国別拡張 CCSID
1141、273 オーストリア、ドイツ ECECP、CECP
1142、277 デンマーク、ノルウェー ECECP、CECP
1143、278 フィンランド、スウェーデン ECECP 、CECP
1144、280 イタリア ECECP、CECP
1145、284 スペイン、ラテンアメリカ (スペイ ン語) ECECP、CECP
1146、285 英国 ECECP、CECP
1147、297 フランス ECECP、CECP
1148、500 国際 ECECP、CECP
1149、871 アイスランド ECECP、CECP


表 35. XML 文書でサポートされている ASCII CCSID

CCSID 内容
813 ISO 8859-7 ギリシャ語/Latin
819 ISO 8859-1 Latin 1/オープン・シ ステム
920 ISO 8859-9 Latin 5 (ECMA-128、ト ルコ TS-5881)

ASCII XML 文書を解析する場合、特殊レジスター XML-TEXT にあ る処理プロシージャーに渡される文書のフラグメントは、ASCII でエンコー ドされます。 移動や比較のような ILE COBOL 操作は、適切な操作 に対する EBCDIC エンコードまたは国別文字に依拠しているので、文書フラ グメントを変換してから、それらを使用しなければなりません。 XML 文書が COBOL プログラムにあるときにこれを行うには、MOVE ステートメントを使用して、まず XML 文書の ASCII CCSID から 国別文字に変換します。 次に、必要な場合、MOVE ステートメントを使用して、その結果を国別文字から EBCDIC に変換します。

他の CCSID でエンコードされた COBOL プログラムの XML 文書については、MOVE ス テートメントを使用して、それらを国別文字に変換することで、解析で きます。特殊レジスター XML-NTEXT にある処理プロシージャーに渡された 文書テキストの個々の部分については、その後、必要に応じて、MOVE ステートメント を使用して元の CCSID にもう一度変換できます。

XML 文書が IFS ファイルにある場合、オブジェクト・コピー (CPY) コマンドを使用して、 CCSID 変換を実行します。パーサーから戻される文書フラグメントでの作業をより簡単にするには、XML PARSE で文書を使用する前に以下を実行することをお勧めします。

  1. 各 xml レコードの開始で '<' タグに先行する文字を除去する必要があります。
  2. IFS ファイルでの各行の終了は、LF (改行) ではなく、CR (復帰) のみを持つ必要があります。
  3. XML 文書を UCS-2 CCSID 13488、またはジョブの CCSID に変換します。
  4. XML 文書のエンコード宣言を手動で変更し、文書の実際の CCSID を指定します。

文書のエンコードの指定および パーサーがエンコードを決定する方法について詳しくは、「ILE COBOL プログラマーの手引き」を参照してください。


[ ページのトップ | 前ページ | 次ページ | 目次 | 索引 ]