IM Centre de documentation de Relationship Resolution, Version 4.2

Rapport récapitulatif de chargement

Le rapport Récapitulatif de chargement récapitule les statistiques et les caractéristiques de qualité par source de données. Il contient des informations sur les fichiers sources de données. Ce rapport permet de déterminer les statistiques de charge, le nombre de résolutions d'entité et d'alertes générées par cette charge, les informations générales sur la qualité des données des fichiers chargés, un résumé des actions concernant le document UMF de cette charge et toute exception UMF éventuellement générée par cette charge. Le rapport est trié par groupe de charges, source de données, fichier de données puis date de chargement.

Pour chaque fichier de données et date de chargement au sein de la source de données et du groupe de charges, le rapport scinde les statistiques en sections :

Récapitulatif de chargement

Cette section peut vous aider à déterminer combien de temps il a fallu pour traiter un certain fichier, de même que vous donner une idée générale de l'utilité globale de ce fichier de source de données en termes de résolution d'entité et de détection de relation.

Date et heure de démarrage
Date et heure où le chargement des données a commencé.
Date et heure de fin
Date et heure où le chargement des données a fini.
Nombre d'enregistrements UMF
Nombre total d'enregistrements chargés à partir de ce fichier de données au cours de la plage de date et heure Démarré etTerminé.
Le nombre Terminé moins le nombre Démarré correspond au nombre de minutes qu'il a fallu pour charger ce fichier particulier, ce qui peut vous donner une idée des performances du système. Il se peut également qu'il indique qu'il vaudrait mieux scinder un certain fichier volumineux en fichiers plus petits afin d'en accélérer le traitement.
Nouvelles identités
Nombre total de nouvelles identités chargées au cours de la plage de date et heure Démarré et Terminé.
% de nouvelles identités
Pourcentage du total des identités de cette charge de données qui sont de nouvelles identités (non vues auparavant par le système)
Nouvelles entités
Nombre total de nouvelles identités résolues au cours de la plage de date et heure Démarré et Terminé.
% de nouvelles entités
Pourcentage du total d'entités qui sont des entités nouvellement résolues à l'issue de cette charge de données.
Le nombre de nouvelles identités et de nouvelles entités peut vous procurer une idée générale de l'intérêt global de cette source de données en termes de résolution d'entité et de détection de relation. Si ces nombres sont bas et le demeurent sur une certaine période, il se peut que cette source de données soit inutile pour atteindre vos objectifs de résolution d'entité.

Récapitulatif de conflit

Utilisez cette section pour consulter les règles et scores de résolution communs aux relations détectées qui ont débouché sur des alertes de rôle. Chaque ligne représente le nombre d'alertes de rôle qui ont été générées, selon les critères mentionnés.

Règle de résolution
Nom de la règle de résolution appliquée pour évaluer l'identité et l'entité au cours de la résolution d'entité et de la détection de relation.
Description d'alerte
Nom de la règle d'alerte de rôle qui a déclenché l'alerte.
Gravité
Indicateur, défini par l'utilisateur, servant à mesurer la priorité ou l'importance de cette alerte de rôle.
Score de résolution
Score (0-100) de la règle de résolution attribué à l'identité et à l'entité impliqués dans l'alerte de rôle.
Ce score indique le degré de ressemblance entre l'identité et l'entité. Un score de 100 signifie que l'enregistrement d'identité a été résolu sous la forme de l'entité.
Nombres d'alertes
Nombre total d'alertes de rôle déclenchées selon la description de la règle d'alerte de rôle, la règle de résolution et le score de résolution.

Récapitulatif des relations

Cette section permet de consulter les attributs communs aux relations détectées qui n'ont pas déclenché d'alerte de rôle. Chaque ligne représente le nombre de relations qui ont été détectées, selon les critères mentionnés.

Règle de résolution
Nom de la règle de résolution appliquée pour évaluer l'identité et l'entité au cours de la résolution d'entité et de la détection de relation.
Score de résolution
Score (0-100) de la règle de résolution attribué à l'identité et à l'entité impliqués dans l'alerte de rôle.
Ce score indique le degré de ressemblance entre l'identité et l'entité. Un score de 100 signifie que l'enregistrement d'identité a été résolu sous la forme de l'entité.
Score de relation
Score de relation (0-100) de la règle de résolution attribué à l'identité et à l'entité impliqués dans l'alerte de rôle. Ce score indique le degré de relation entre l'identité et l'entité.
Un score de 100 signifie que l'enregistrement d'identité a été résolu sous la forme de l'entité. Plus le score de relation est élevé, plus l'identité et l'entité sont étroitement apparentées, selon les attributs concordants.
Nombre de relations
Nombre total de relations qui sont détectées selon la règle de résolution, le score de résolution et le score de relation.

Récapitulatif qualitatif

Consultez les informations de cette section pour évaluer la qualité des données de chaque fichier source. Cette section indique la qualité par type d'attribut au sein d'un type de segment UMF et de document UMF. En consultant le récapitulatif qualitatif avec celui des exceptions UMF, vous pouvez savoir quels fichiers sources de données posent des problèmes de qualité ou d'UMF défectueux qu'il importe de régler. Vous pouvez généralement remédier à ces problèmes via la configuration ETL ou DQM/de source de données avant de traiter le fichier de source de données.

Dans certains cas, cette section peut révéler qu'une source de données est de qualité si médiocre qu'il ne faudrait plus la traiter pour la résolution d'entité.

Type de document
Nom du type de document UMF qui contient le type de données data mentionné dans Type de données. Cette valeur est généralement UMF_ENTITY.
Nom de la table
Nom de la table de base de données qui contient les données de segment UMF du type de données mentionné dans Type de données.
Type de données
Valeur réelle des données, telle que mentionnée dans les balises UMF de type d'attribut des enregistrements entrants. Ce type correspond à un segment UMF figurant dans le nom de table. Par exemple, si le nom de table est ADDRESS et que le type de données mentionné est H, les informations qualitatives évaluent le type d'adresse Domicile.
Si vous ne reconnaissez pas un type de données, cela peut indiquer que le fichier de source de données n'est pas correctement associé à la combinaison adéquate de documents, segments et balises UMF. Vérifiez dans la section de récapitulatif des exceptions si un segment UMF et une balise UMF concordants ont provoqué des exceptions de segment. Si le problème provient d'un format UMF incorrect, le nombre Pourcentage inutilisable de la section Récapitulatif qualitatif et le nombre d'exceptions de segment de la section Exceptions UMF concordent généralement.
Nombre d'enregistrements
Nombre total d'enregistrements d'identité entrants contenant ce type de données.
Nombre générique
Nombre total d'enregistrements d'identité entrants où ce type de données est considéré comme générique ; il est possible qu'il ne soit plus utilisé au cours du processus de résolution d'entité.
Pourcentage inutilisable
Nombre total d'enregistrements d'identité entrants où ce type de données est considéré comme de qualité médiocre. Ce nombre peut révéler un problème de saisie de données ou de transformation ETL dans le fichier de source de données.
Pourcentage utilisable
Pourcentage des enregistrements d'identité entrants de ce segment UMF et type de données exploitables en termes de résolution d'entité et de détection de relation. (Nombre d'enregistrements moins Nombre générique moins Pourcentage inutilisable divisé par nombre d'enregistrements égale Pourcentage utilisable.)
Pourcentage d'identité
Pourcentage des enregistrements d'identité entrants de cette source de données qui contenaient ce type de données.

Récapitulatif d'attribut

Cette section permet de consulter dans le fichier de source de données les attributs qui ont contribué à détecter les relations et à déclencher des alertes de rôle. Chaque attribut est associé à un segment UMF spécifique, et cette section montre le nombre de relations détectées et d'alertes de rôle déclenchées, selon les données présentes dans le segment UMF entrant.

Nom du segment
Nom du segment UMF, qui s'associe directement à un attribut.
Type de données
Mentionne le type d'attribut (ou type de données), au sein du segment UMF, qui correspond à la description de la précision. Il se peut que le rapport mentionne soit un type d'attribut particulier, soit TOUS, ce qui indique tous les types d'attribut du segment UMF.
Description de précision
Description du seuil concordant entre un attribut issu d'une identité entrante et un attribut issu d'une entité existante.
Alertes de rôle
Nombre total d'alertes de rôle déclenchées selon ce segment UMF, le type de données et la description de précision.
Relations
Nombre total d'alertes de relations détectées selon ce segment UMF, le type de données et la description de précision.

Récapitulatif de document UMF

Cette section permet de valider le nombre total d'enregistrements entrants dans un fichier de source de données, selon l'action à effectuer sur l'enregistrement : nouveau/ajout, modification, suppression. Vous pouvez réconcilier ces nombres en Nombre d'enregistrements dans la section Récapitulatif de chargement.

Type de document
Nom du type de document UMF. Cette valeur est généralement UMF_ENTITY.
Action
Type d'action à appliquer à l'enregistrement d'identité entrant :
  • A : ajout
  • C : modification
  • D : suppression
Dans le cadre du processus ETL (extraction, transformation et chargement), les enregistrements d'identité sont généralement étiquetés au moyen du format UMF afin d'indiquer quelle action effectuer sur chacun au cours du traitement par le système.
Nombre d'enregistrements UMF
Nombre total d'enregistrements traités pour chaque type d'action au sein du type de document.
Pourcentage
Pourcentage du nombre total d'enregistrements chargés qui correspond à Nombre d'enregistrements (la somme ne doit pas dépasser 100%).

Récapitulatif des exceptions

Ces informations aident à repérer les enregistrements d'identité défectueux, tels que ceux dont le format UMF est syntaxiquement incorrect. L'exception décrit le problème, tandis que le nom de table et l'élément indiquent les segments et enregistrements défectueux. Le comptage montre combien d'enregistrements du fichier comportaient ce format UMF incorrect.

Type de document
Nom du type de document UMF. Cette valeur est généralement UMF_ENTITY.
Action
Type d'action à appliquer à l'enregistrement d'identité entrant :
  • A : ajout
  • C : modification
  • D : suppression
Dans le cadre du processus ETL (extraction, transformation et chargement), les enregistrements d'identité sont généralement étiquetés au moyen du format UMF afin d'indiquer quelle action effectuer sur chacun au cours du traitement par le système.
Segment
Nom du segment UMF où l'exception est survenue.
Balise UMF
Valeur de la balise UMF qui a provoqué l'exception UMF.
Exception
ID de message ou autre code indiquant le type d'exception UMF survenu et renseignant sur la manière de remédier à cette exception. Cette information est également disponible dans la table UMF_EXCEPT.
Nombre d'exceptions de segment
Nombre total de ce type d'exception UMF.
Vérifiez le pourcentage inutilisable à la section Récapitulatif qualitatif pour savoir si un type de données concordant est signalé comme étant de qualité médiocre ou inutilisable. Si le problème provient d'un format UMF incorrect, le nombre Pourcentage inutilisable de la section Récapitulatif qualitatif et le nombre d'exceptions de segment de la section Exceptions UMF concordent généralement pour le même segment UMF et les mêmes balises UMF.
Tâches associées
Consultation des rapports statistiques
Information associée
Fenêtre de critères du rapport Récapitulatif de chargement


Appréciations en retour

Dernière mise à jour : 2007