WebSphere MQ Telemetry Transport y UTF-8

UTF-8 es una codificación eficaz de series de caracteres Unicode que optimiza la codificación de caracteres ASCII como soporte a las comunicaciones basadas en texto.

El protocolo WebSphere MQ Telemetry Transport utiliza un subconjunto de UTF-8. Sólo se da soporte a caracteres de un solo byte (no extendidos).

En la tabla siguiente se muestra el formato de serie de caracteres UTF.

bit 7 6 5 4 3 2 1 0
byte 1 Longitud de mensaje MSB
byte 2 Longitud de mensaje LSB
bytes 3 ... Datos de caracteres codificados

La longitud del mensaje es el número de bytes de series de caracteres codificadas, no el número de caracteres. Aunque para la series de caracteres ASCII es lo mismo. El formato de caracteres codificados para los códigos ASCII 0x01 a 0x7F se muestran en la tabla siguiente.

bit 7 6 5 4 3 2 1 0
  0 Código de caracteres ASCII

Por ejemplo, la serie de texto ASCII OTWP se codifica en UTF-8 como se muestra en la tabla siguiente.

bit 7 6 5 4 3 2 1 0
byte 1 Longitud de mensaje MSB (0x00)
  0 0 0 0 0 0 0 0
byte 2 Longitud de mensaje LSB (0x04)
  0 0 0 0 0 1 0 0
byte 3 'O' (0x4F)
  0 1 0 0 1 1 1 1
byte 4 'T' (0x54)
  0 1 0 1 0 1 0 0
byte 5 'W' (0x57)
  0 1 0 1 0 1 1 1
byte 6 'P' (0x50)
  0 1 0 1 0 0 0 0

Los métodos de corriente de datos writeUTF() y readUTF() de Java utilizan este formato.

Conceptos relacionados
WebSphere MQ Telemetry Transport

Referencia relacionada
Nombre de tema de WebSphere MQ Telemetry Transport