Codage de caractères

Définissez le codage de caractères au niveau de la base de données, de la table ou au niveau de la colonne ou du paramètre.

Par exemple, le codage par défaut de votre base de données peut être défini sur UTF-8 mais une table de cette base de données peut explicitement définir le codage sur SHIFT-JIS. Le codage d'une colonne de cette table peut être explicitement défini par ISO-8859-1 alors que toutes les autres colonnes ne spécifient pas de codage, elles héritent donc du codage par défaut SHIFT-JIS de la table.

Le dispositif d'intégration peut convertir un type de codage en un autre, pendant l'exécution. Par exemple, l'orchestration peut lire des données d'entrée provenant d'une table dont le codage est ISO-8859-1, puis écrire ces données dans une colonne dont le codage est UTF-8.

Pour définir des codages de caractère :

  • Au niveau Base de données - Sélectionnez le type de codage dans la liste Codage de la boîte de dialogue Editer un noeud final ou Créer un noeud final.
  • Au niveau Table - Sélectionnez le type de codage dans la liste Codage du panneau Sélectionner la table.
  • Au niveau Colonne - Cliquez sur la zone Codage pour la colonne souhaitée, dans le panneau Sélectionner la table, et faites votre choix dans la liste.
Voir ci-après pour une description des types d'encodage de caractères par défaut.
Remarque : Vous devez laisser la zone de codage vide pour les types de données binaires suivants :
  • Blob
  • Binaire
  • Varbinaire

Pour définir le type de codage sélectionnez l'une des options suivantes :

  • Dans la liste Codage, sélectionnez un type de codage par défaut.
  • Entrez le type de codage directement en cliquant dans la zone Codage et en saisissant le type de codage.
Certains types de codage par défaut sont répertoriés dans le tableau suivant :
Tableau 1.
Codage Description
UTF-8 UTF-8 est un codage de caractères standard pour Unicode ou ISO-10646. Chacune de ces normes affecte un numéro unique à chaque caractère utilisé dans les langues modernes. Il s'agit du codage par défaut.
US-ASCII Egalement connu sous le nom d'ASCII, il s'agit du codage de caractères de base sur les ordinateurs Windows et UNIX.
ISO-8859-1 Appelé aussi Latin1, ce codage inclut le codage ASCII plus des caractères pour de nombreuses langues d'Europe occidentale.
EBCDIC-XML-US Il s'agit du codage de caractères de base sur les ordinateurs IBM®. EBCDIC-US, de même qu'ASCII, est un codage de caractères basé sur l'américain.
SHIFT-JIS Egalement appelé Katakana, définit le japonais.
Remarque : Certains caractères codés sur deux octets ne sont pas convertis à l'aide du codage SHIFT-JIS. Pour plus d'informations, voir Utilisation du codage Shift-JIS.