El Informe de resumen de carga resume las estadísticas y las características de calidad
por fuente de datos. Contiene información acerca de los archivos de fuente de datos. Utilice este
informe para determinar las estadísticas de rendimiento de la carga, el número de resoluciones de
entidades y las alertas generadas por esta carga, la información general acerca de la calidad de los
datos de los archivos cargados, un resumen de las acciones realizadas en el documento UMF para esta carga y
cualquier excepción UMF generada por esta carga.
El informe se clasifica por grupo de carga, fuente de datos, archivo de datos y después fecha de
carga.
Para cada archivo de datos y fecha cargados en la fuente de datos y grupo de carga,
el informe desglosa las estadísticas en secciones:
- Resumen de carga
- Resumen de alertas de rol
- Resumen de relaciones
- Resumen de calidad
- Resumen de resolución
- Resumen de documento UMF
- Resumen de excepciones
Resumen de carga
Puede utilizar esta sección como ayuda para determinar
cuánto se ha tardado en procesar un archivo en particular, así como para tener una idea general
de la utilidad de este archivo de fuente de datos en la resolución global de entidades y
la detección de relaciones.
- Fecha y hora de inicio
- Fecha y hora en que ha empezado la carga de datos.
- Fecha y hora de finalización
- Fecha y hora en que ha finalizado la carga de datos
- Recuento de registros UMF
- Número total de registros cargados desde este archivo de datos entre las fechas y horas de
Inicio y de Finalización.
- El número de Finalización menos el número de Inicio es el
número de minutos que ha tardado la carga de este archivo en particular, lo que puede dar una idea del
rendimiento del sistema. También puede indicar que un archivo de fuente de datos mayor
se debe dividir entre archivos más pequeños para un proceso más rápido.
- Nuevas identidades
- Número total de nuevas identidades cargadas entre las fechas y horas
de Inicio y de Finalización.
- % de nueva identidad
- Porcentaje del total de identidades de esta carga de datos que son nuevas identidades
(el sistema no las ha visto antes)
- Nuevas entidades
- Número total de nuevas entidades resueltas entre las fechas y horas
de Inicio y de Finalización.
- % Entidades nuevas
- Porcentaje del total de entidades nuevas que se han resuelto como resultado de esta
carga de datos.
- El número de nuevas identidades y nuevas entidades puede proporcionar una idea general
del valor de esta fuente de datos en la resolución global de entidades y la detección
de relaciones. Si estos números son bajos y siguen bajos durante un periodo de
tiempo, puede que esta fuente de datos no esa útil para conseguir los objetivos de resolución
de entidades de la organización.
Resumen de alertas de rol
Utilice esta sección para ver las normas
de resolución y las puntuaciones de resolución comunes para las relaciones detectadas que han
dado lugar a alertas de rol. Cada fila representa el número de alertas de rol que se han generado,
basándose en los criterios listados.
- Norma de resolución
- Nombre de la norma de resolución utilizada para evaluar la identidad y entidad durante
la resolución de entidades y la detección de relaciones.
- Descripción de alerta
- Nombre de la norma de alerta de rol que ha desencadenado la alerta de rol.
- Gravedad
- Indicador definido por el usuario para medir la prioridad o importancia de esta alerta
de rol.
- Puntuación de resolución
- Puntuación de resolución (0-100) para la norma de resolución dada a la identidad
y entidad implicadas en la alerta de rol.
- Esta puntuación indica el grado de similitud entre la identidad y la entidad. Una puntuación de 100 significa que el registro de identidad se ha resuelto para la entidad.
- Recuento de alertas
- Número total de alertas de rol generadas basándose en la descripción de norma de alerta de rol, la
norma de resolución y la puntuación de resolución.
Resumen de relaciones
Utilice esta sección para ver los atributos comunes
para las relaciones detectadas que no han generado una alerta de rol. Cada fila representa el número
de relaciones que se han detectado, basándose en los criterios listados.
- Norma de resolución
- Nombre de la norma de resolución utilizada para evaluar la identidad y entidad durante
la resolución de entidades y la detección de relaciones.
- Puntuación de resolución
- Puntuación de resolución (0-100) para la norma de resolución dada a la identidad
y entidad implicadas en la alerta de rol.
- Esta puntuación indica el grado de similitud entre la identidad y la entidad. Una puntuación de 100 significa que el registro de identidad se ha resuelto para la entidad.
- Puntuación de relación
- Puntuación de relación (0-100) para la norma de resolución dada a la identidad
y entidad implicadas en la alerta de rol. Esta puntuación indica el grado de relación entre
la identidad y la entidad.
- Una puntuación de 100 significa que el registro de identidad se ha resuelto para la entidad. Cuanto
mayor sea la puntuación de relación, más próxima será la relación entre la identidad y la entidad,
basándose en los atributos de coincidencia.
- Recuento de relaciones
- Número total de relaciones que se detectan basándose en la norma de resolución, la
puntuación de resolución y la puntuación de relación.
Resumen de calidad
Utilice la información de esta sección para
evaluar la calidad de los datos de cada archivo de fuente de datos. La sección indica
la calidad por tipo de atributo de un segmento UMF y tipo de documento UMF. Mediante la revisión del resumen de calidad con el resumen de excepciones UMF, puede ver
los archivos de fuente de datos que tienen problemas de calidad o con un UMF mal formado que se deben
arreglar. Normalmente, puede resolver estos temas a través de ETL o la configuración
de DQM/fuente de datos antes de procesar el archivo de fuente de datos.
En
algunos casos, esta sección puede indicar que una fuente de datos tiene una calidad
tan pobre que ya no se debe procesar para la resolución de entidades.
- Tipo de documento
- Nombre del tipo de documento UMF que contiene el tipo de datos listado en el tipo de
datos. Normalmente, este valor es UMF_ENTITY.
- Nombre de tabla
- Nombre de la tabla de base de datos que almacena los datos de segmento UMF para el tipo de datos
listado en Tipo de datos.
- Tipo de datos
- Valor de datos real, tal como se lista en los códigos UMF de tipo de atributo de
los registros de entrada. Este tipo corresponde a un segmento UMF listado en Nombre de tabla. Por
ejemplo, si el Nombre de tabla es ADDRESS y el Tipo de datos listado
es H, la información de calidad evalúa el tipo de dirección
de tipo Domicilio.
- Si no reconoce un tipo de datos, puede indicar que el archivo de fuente de datos
no está correlacionado correctamente con la combinación adecuada de documentos,
segmentos y códigos UMF. Compruebe la sección Resumen de excepción para ver si un segmento
UMF y un código UMF coincidentes han causado una o varias excepciones de segmento. Si el problema
es un UMF incorrecto, con frecuencia coinciden los números del Recuento de baja calidad de la sección Resumen de calidad
con el Recuento de excepción de segmentos de la sección Excepción UMF.
- Recuento de registros
- Número total de registros de identidad de entrada que contienen este tipo de datos.
- Recuento genérico
- Número total de registros de identidad de entrada donde este tipo de datos se considera
genérico, y ya no se puede utilizar durante el proceso de resolución de entidades.
- Recuento de baja calidad
- Número total de todos los registros de identidad de entrada donde este tipo de datos
se considera de baja calidad. Este número puede indicar un problema de entrada de datos o de
transformación ETL en el archivo de fuente de datos.
- Porcentaje utilizable
- Porcentaje de registros de identidad de entrada de este segmento UMF y tipo de datos
que se pueden utilizar para la resolución de entidades y detección de relaciones. (Recuento de registros
menos Recuento genérico menos Recuento de baja calidad) dividido por el recuento de registro es
igual al Porcentaje utilizable.)
- Porcentaje de identidad
- Porcentaje de los registros de identidad de entrada de esta fuente de datos que contenían este
tipo de datos.
Resumen de atributos
Utilice esta sección para ver los atributos
del archivo de fuente de datos que han ayudado a detectar relaciones y generar alertas de rol. Cada atributo se correlaciona con un segmento UMF específico, y esta sección muestra
el número de relaciones detectadas y alertas de rol generadas, basadas en los datos del
segmento UMF de entrada.
- Nombre de segmento
- Nombre del segmento UMF, que se correlaciona directamente con un atributo.
- Tipo de datos
- Lista el tipo de atributo (o tipo de datos) del segmento UMF correspondiente a
la Descripción de precisión. El informe puede listar un tipo de atributo específico o
listar ALL, que indica todos los tipos de atributo del segmento
UMF.
- Descripción de precisión
- Descripción del umbral de coincidencia entre un atributo de una identidad de entrada
y un atributo de una entidad existente.
- Alertas de roles
- Número total de alertas de rol generadas basándose en este segmento UMF, el tipo de
datos y la descripción de precisión.
- Relaciones
- Número total de relaciones detectadas basándose en este segmento UMF, el tipo de datos
y la descripción de precisión
Resumen de documento UMF
Puede utilizar esta sección para
validar el número total de registros de entrada en un archivo de fuente de datos, basándose
en la acción que se debe realizar en el registro: nuevo/añadir, cambiar o suprimir.
Puede conciliar estos números en el Recuento de registros de la sección Resumen de carga.
- Tipo de documento
- Nombre del tipo de documento UMF. Normalmente, este valor es UMF_ENTITY.
- Acción
- Tipo de acción para el registro de identidad de entrada:
- A para añadir
- C para cambiar
- D para suprimir
- Como parte del proceso ETL, normalmente los registros de identidad se codifican a través de
UMF para indicar cómo se debe actuar en cada registro de entrada durante el proceso del sistema.
- Recuento de registros UMF
- Número total de registros procesados para cada tipo de acción dentro del tipo
de documento
- Porcentaje
- Porcentaje del total de registros cargados que el Recuento de registros representa.
(La suma no debe exceder del 100%.)
Resumen de excepciones
Utilice esta información como ayuda para
señalar los registros de identidad incorrectos, como los que tienen un UMF incorrectamente formado. La excepción describe
el problema, mientras que el nombre de tabla y elemento muestran el segmento y registros que son
incorrectos. El recuento muestra cuántos registros del archivo contenían este UMF incorrecto.
- Tipo de documento
- Nombre del tipo de documento UMF. Normalmente, este valor es UMF_ENTITY.
- Acción
- Tipo de acción para el registro de identidad de entrada:
- A para añadir
- C para cambiar
- D para suprimir
Como parte del proceso ETL, normalmente los registros de identidad se codifican a través de
UMF para indicar cómo se debe actuar en cada registro de entrada durante el proceso del sistema.
- Segmento
- Nombre del segmento UMF donde se ha producido la excepción.
- Código UMF
- Valor del código UMF que ha causado la excepción UMF.
- Excepción
- ID de mensaje u otro código de excepción para indicar el tipo de excepción UMF
que se ha producido y dar información acerca de cómo resolver la excepción. Esta
información también está disponible en la tabla UMF_EXCEPT.
- Recuento de excepción de segmentos
- Número total de este tipo de excepción UMF.
- Compruebe el Recuento de baja calidad en la sección Resumen de calidad para ver si
se ha informado que un tipo de datos coincidente tiene baja calidad o no se puede utilizar. Si el problema
es un UMF incorrecto, los números del Recuento de baja calidad de la sección Resumen de calidad y
el Recuento de excepción de segmentos en la sección Excepción UMF coinciden con frecuencia
para el mismo segmento UMF y códigos UMF.