IM InfoSphere Identity Insight, Versión 8.0


Parámetros de almacenamiento de datos de atributo grandes

Para que el sistema almacene y procese datos de atributos grandes para a puntuación, los metadatos se deben convertir a UMF (Universal Message Format) y se deben almacenar en las columnas apropiadas.

Utilice las columnas ATTR_VALUE y ATTR_LARGE_DATA para almacenar datos de atributo grandes y desestructurados para atributos personalizados y aplicaciones de puntuación.

Nombre de columna y código UMF Tipo y tamaño de datos Necesario Explicación
ATTR_VALUE varchar(255) (predeterminado) redimensionable hasta 8 k Datos utilizados como uno de los atributos en un proceso ETL con plugins de puntuación base.

En los casos en que los datos superan los 8 k y están en formato binario, almacene los datos en la columna ATTR_LARGE_DATA y cree un identificador exclusivo para los datos en la columna ATTR_VALUE. El identificador ATTR_VALUE se utiliza para comparar y puntuar. Por ejemplo, puede crear un hash unidireccional MD5 (algoritmo 5 Message-Digest) que se pueda comparar y mostrar en el Visualizador y en los informes.

El tamaño máximo de la columna depende de la base de datos. Para los datos binarios que superen 255/3 y deban almacenarse en ATTR_VALUE, deberá redimensionarse la columna. Por motivos de rendimiento, debe considerar el reajuste de la memoria caché de la base de datos porque es probable que quepan menos filas en la memoria caché.

ATTR_LARGE_DATA Objeto de caracteres largos (CLOB), utilizado para datos que superen los 8 k. No Almacénelo como datos de carácter. Por ejemplo, utilice la codificación Base64 de datos binarios.

Utilice esta columna para almacenar los datos de atributo que sean demasiado grandes para la columna ATTR_VALUE.

ATTR_LARGE_DATA es una columna de tipo CLOB (objeto de carácter largo) que puede manejar datos de tamaño ilimitado.

Estos datos están disponibles para la resolución de entidades. El autor del plugin de comparación personalizado debe conocer la estructura de los datos. El Visualizador no mostrará los datos porque no tienen un formato estándar y serán distintos según el tipo de sistema.

El rendimiento de CLOB no será tan bueno como el de una columna varchar porque un CLOB no puede almacenarse en la memoria caché y necesita lectura de disco, lo cual hace preferible ATTR_VALUE. Aumentar el tamaño de ATTR_VALUE provocará que se almacenen pocos datos de atributo en la memoria caché; por tanto, es mejor utilizar ATTR_LARGE_DATA sólo para datos inferiores a 8 k para asegurar que otros atributos de menor tamaño como los de género y DOB se almacenen correctamente en la memoria caché. Esta cuestión depende del arquitecto. Póngase en contacto con el administrador de la base de datos.

Ejemplo

A continuación se muestra un ejemplo de una salida hash MD5 de datos binarios grandes:
<ATTRIBUTE><ATTR_TYPE>BIOMETRIC-1</ATTR_TYPE><ATTR_VALUE>214b21fc3e040f844a07710b1bb451a0
</ATTR_VALUE><ATTR_LARGE_DATA><![H4sICBRTqkgAA2Zvby50eHQAK0ktLuHlAgDkTqoPBgAAAA==]>
</ATTR_LARGE_DATA></ATTRIBUTE>
Los valores ATTR_LARGE_DATA reales son mayores que los mostrados en el ejemplo anterior.



Comentarios



Última actualización: 2009