IM InfoSphere Identity Insight, Versión 8.0


Gestión de calidad de datos (DQM)

La Gestión de calidad de datos (DQM) es el proceso de interconexión que comprueba que los datos tengan los valores necesarios, tipos de datos válidos y códigos válidos. También puede configurar DQM de modo que corrija los datos proporcionando valores por omisión, formateando números y fechas y añadiendo nuevos códigos.

La Gestión de calidad de datos, junto con higiene y estandarización de nombres e higiene y estandarización de direcciones, está diseñada para optimizar y mejorar la calidad de los datos. Esta preparación de la calidad de los datos constituye un paso esencial en la resolución de entidades, porque aumenta la fiabilidad de las entidades resueltas resultantes y las relaciones detectadas.

Para aplicar la gestión de calidad de datos a los datos cargados en el sistema, debe configurar normas de gestión de calidad de datos (o normas DQM). Las normas DQM pueden realizar varias funciones de reparación, limpieza y estandarización sobre valores de datos de entidades de entrada, como formatear correctamente los números, identificar y corregir errores clericales y de transposición e identificar y corregir imprecisiones intencionadas incorporadas por alguien que intente ocultar sus identidades.

El producto viene preconfigurado con varias normas SQM por segmento UMF que manejan los problemas más típicos de calidad de datos correspondientes a dicho segmento UMF. Pero puede configurar normas DQM adicionales si las necesita. Sin embargo, antes de hacerlo debe estar familiarizado con la calidad de los datos original y con el proceso ETL (extracción, transformación y carga) utilizado para transformar los datos de identidades en UMF. Cuando sepa qué mejoras en los datos hay que realizar, puede seleccionar las normas DQM, funciones y valores adecuados que aplicar a cada tipo de datos de identidades que necesitan una optimización de la calidad de los datos.

Ejemplo de utilización de una norma DQM

Por ejemplo, el formato de fecha del sistema es DD/MM/AAAA. Pero en varios de sus orígenes de datos, los valores de fecha están formateados como MM-DD-AAAA. Puede añadir la norma DQM 204 al segmento UMF <NUMBER>, configurándolo de modo que arregle todas las fechas de entrada formateadas como MM-DD-AAAA por el formato de fecha DD/MM/AAAA.

Información relacionada

Referencia de reglas DQM



Comentarios



Última actualización: 2009