Le rapport Récapitulatif de chargement récapitule les statistiques et les caractéristiques de qualité par source de données. Il contient des informations sur les fichiers sources de données. Ce rapport permet
de déterminer les statistiques de charge, le nombre de résolutions d'entité
et d'alertes générées par cette charge, les informations générales sur
la qualité des données des fichiers chargés, un résumé des actions concernant le
document UMF de cette charge et toute exception UMF éventuellement générée par cette charge.
Le rapport est trié par groupe de charges, source de données, fichier de données puis date de
chargement.
Pour chaque fichier de données et date de chargement au sein de la source de données et du groupe de charges,
le rapport scinde les statistiques en sections :
- Récapitulatif de chargement
- Récapitulatif de conflit
- Récapitulatif des relations
- Récapitulatif qualitatif
- Récapitulatif de résolution
- Récapitulatif de document UMF
- Récapitulatif des exceptions
Récapitulatif de chargement
Cette section peut vous aider à déterminer
combien de temps il a fallu pour traiter un certain fichier, de même que vous donner une idée générale
de l'utilité globale de ce fichier de source de données en termes de résolution d'entité et
de détection de relation.
- Date et heure de démarrage
- Date et heure où le chargement des données a commencé.
- Date et heure de fin
- Date et heure où le chargement des données a fini.
- Nombre d'enregistrements UMF
- Nombre total d'enregistrements chargés à partir de ce fichier de données au cours de la plage de date et heure Démarré etTerminé.
- Le nombre Terminé moins le nombre Démarré correspond au
nombre de minutes qu'il a fallu pour charger ce fichier particulier,
ce qui peut vous donner une idée des performances du système. Il se peut également qu'il
indique qu'il vaudrait mieux scinder un certain fichier volumineux en fichiers plus petits
afin d'en accélérer le traitement.
- Nouvelles identités
- Nombre total de nouvelles identités chargées au cours de la plage de date et heure Démarré et Terminé.
- % de nouvelles identités
- Pourcentage du total des identités de cette charge de données qui sont de nouvelles identités
(non vues auparavant par le système)
- Nouvelles entités
- Nombre total de nouvelles identités résolues au cours de la plage de date et heure Démarré et Terminé.
- % de nouvelles entités
- Pourcentage du total d'entités qui sont des entités nouvellement résolues à l'issue
de cette charge de données.
- Le nombre de nouvelles identités et de nouvelles entités peut vous procurer une idée
générale de l'intérêt global de cette source de données en termes de résolution d'entité et
de détection de relation. Si ces nombres sont bas et le demeurent sur une certaine
période, il se peut que cette source de données soit inutile pour atteindre vos objectifs
de résolution d'entité.
Récapitulatif de conflit
Utilisez cette section pour consulter les règles
et scores de résolution communs aux relations détectées qui ont débouché
sur des alertes de rôle. Chaque ligne représente le nombre d'alertes de rôle qui ont été générées,
selon les critères mentionnés.
- Règle de résolution
- Nom de la règle de résolution appliquée pour évaluer l'identité et l'entité au cours
de la résolution d'entité et de la détection de relation.
- Description d'alerte
- Nom de la règle d'alerte de rôle qui a déclenché l'alerte.
- Gravité
- Indicateur, défini par l'utilisateur, servant à mesurer la priorité ou l'importance de cette
alerte de rôle.
- Score de résolution
- Score (0-100) de la règle de résolution attribué à l'identité et
à l'entité impliqués dans l'alerte de rôle.
- Ce score indique le degré de ressemblance entre l'identité et
l'entité. Un score de 100 signifie que l'enregistrement d'identité a été résolu sous la forme de l'entité.
- Nombres d'alertes
- Nombre total d'alertes de rôle déclenchées selon la description de la règle d'alerte de rôle,
la règle de résolution et le score de résolution.
Récapitulatif des relations
Cette section permet de consulter les
attributs communs aux relations détectées qui n'ont pas déclenché d'alerte de
rôle. Chaque ligne représente le nombre de relations qui ont été détectées,
selon les critères mentionnés.
- Règle de résolution
- Nom de la règle de résolution appliquée pour évaluer l'identité et l'entité au cours
de la résolution d'entité et de la détection de relation.
- Score de résolution
- Score (0-100) de la règle de résolution attribué à l'identité et
à l'entité impliqués dans l'alerte de rôle.
- Ce score indique le degré de ressemblance entre l'identité et
l'entité. Un score de 100 signifie que l'enregistrement d'identité a été résolu sous la forme de l'entité.
- Score de relation
- Score de relation (0-100) de la règle de résolution attribué à l'identité et
à l'entité impliqués dans l'alerte de rôle. Ce score indique le degré de relation entre l'identité et
l'entité.
- Un score de 100 signifie que l'enregistrement d'identité a été résolu sous la forme de l'entité. Plus le score de relation est élevé,
plus l'identité et l'entité sont étroitement apparentées,
selon les attributs concordants.
- Nombre de relations
- Nombre total de relations qui sont détectées selon la règle de résolution,
le score de résolution et le score de relation.
Récapitulatif qualitatif
Consultez les informations de cette section
pour évaluer la qualité des données de chaque fichier source. Cette section
indique la qualité par type d'attribut au sein d'un type de segment UMF et de document
UMF. En consultant le récapitulatif qualitatif avec celui des exceptions UMF, vous pouvez savoir
quels fichiers sources de données posent des problèmes de qualité ou d'UMF défectueux qu'il importe
de régler. Vous pouvez généralement remédier à ces problèmes via la configuration ETL
ou DQM/de source de données avant de traiter le fichier de source de données.
Dans
certains cas, cette section peut révéler qu'une source de données est de qualité
si médiocre qu'il ne faudrait plus la traiter pour la résolution d'entité.
- Type de document
- Nom du type de document UMF qui contient le type de données data mentionné dans
Type de données. Cette valeur est généralement UMF_ENTITY.
- Nom de la table
- Nom de la table de base de données qui contient les données de segment UMF du type de données mentionné dans
Type de données.
- Type de données
- Valeur réelle des données, telle que mentionnée dans les balises UMF
de type d'attribut des enregistrements entrants. Ce type correspond à un segment UMF figurant dans le nom de table. Par exemple,
si le nom de table est ADDRESS et que le type de données mentionné
est H, les informations qualitatives évaluent le
type d'adresse Domicile.
- Si vous ne reconnaissez pas un type de données, cela peut indiquer que le
fichier de source de données n'est pas correctement associé à la combinaison adéquate de documents,
segments et balises UMF. Vérifiez dans la section de récapitulatif des exceptions si un
segment UMF et une balise UMF concordants ont provoqué des exceptions de segment. Si le problème provient
d'un format UMF incorrect, le nombre Pourcentage inutilisable de la
section Récapitulatif qualitatif et le nombre d'exceptions de segment de la section Exceptions UMF
concordent généralement.
- Nombre d'enregistrements
- Nombre total d'enregistrements d'identité entrants contenant ce type de données.
- Nombre générique
- Nombre total d'enregistrements d'identité entrants où ce type de données
est considéré comme générique ; il est possible qu'il ne soit plus utilisé au cours
du processus de résolution d'entité.
- Pourcentage inutilisable
- Nombre total d'enregistrements d'identité entrants où ce type de données
est considéré comme de qualité médiocre. Ce nombre peut révéler un problème de saisie de
données ou de transformation ETL dans le fichier de source de données.
- Pourcentage utilisable
- Pourcentage des enregistrements d'identité entrants de ce segment UMF et type de données
exploitables en termes de résolution d'entité et de détection de relation. (Nombre d'enregistrements
moins Nombre générique moins Pourcentage inutilisable divisé par nombre d'enregistrements
égale Pourcentage utilisable.)
- Pourcentage d'identité
- Pourcentage des enregistrements d'identité entrants de cette source de données qui contenaient
ce type de données.
Récapitulatif d'attribut
Cette section permet de consulter dans le fichier de source de données les attributs
qui ont contribué à détecter les relations et à déclencher
des alertes de rôle. Chaque attribut est associé à un segment UMF spécifique, et cette section
montre le nombre de relations détectées et d'alertes de rôle déclenchées, selon les
données présentes dans le segment UMF entrant.
- Nom du segment
- Nom du segment UMF, qui s'associe directement à un attribut.
- Type de données
- Mentionne le type d'attribut (ou type de données), au sein du segment UMF, qui correspond
à la description de la précision. Il se peut que le rapport mentionne soit un type d'attribut particulier,
soit TOUS, ce qui indique tous les types d'attribut du segment
UMF.
- Description de précision
- Description du seuil concordant entre un attribut issu d'une
identité entrante et un attribut issu d'une entité existante.
- Alertes de rôle
- Nombre total d'alertes de rôle déclenchées selon ce segment UMF,
le type de données et la description de précision.
- Relations
- Nombre total d'alertes de relations détectées selon ce segment UMF,
le type de données et la description de précision.
Récapitulatif de document UMF
Cette section permet de valider
le nombre total d'enregistrements entrants dans un fichier de source de données, selon
l'action à effectuer sur l'enregistrement : nouveau/ajout, modification, suppression.
Vous pouvez réconcilier ces nombres en Nombre d'enregistrements dans la section Récapitulatif de chargement.
- Type de document
- Nom du type de document UMF. Cette valeur est généralement UMF_ENTITY.
- Action
- Type d'action à appliquer à l'enregistrement d'identité entrant :
- A : ajout
- C : modification
- D : suppression
- Dans le cadre du processus ETL (extraction, transformation et chargement), les enregistrements d'identité sont généralement étiquetés
au moyen du format UMF afin d'indiquer quelle action effectuer sur chacun au cours du traitement par le système.
- Nombre d'enregistrements UMF
- Nombre total d'enregistrements traités pour chaque type d'action au sein du
type de document.
- Pourcentage
- Pourcentage du nombre total d'enregistrements chargés qui correspond à Nombre d'enregistrements (la somme ne doit pas dépasser 100%).
Récapitulatif des exceptions
Ces informations aident à
repérer les enregistrements d'identité défectueux, tels que ceux dont le format UMF est syntaxiquement incorrect. L'exception décrit
le problème, tandis que le nom de table et l'élément indiquent les segments et enregistrements
défectueux. Le comptage montre combien d'enregistrements du fichier comportaient ce
format UMF incorrect.
- Type de document
- Nom du type de document UMF. Cette valeur est généralement UMF_ENTITY.
- Action
- Type d'action à appliquer à l'enregistrement d'identité entrant :
- A : ajout
- C : modification
- D : suppression
Dans le cadre du processus ETL (extraction, transformation et chargement), les enregistrements d'identité sont généralement étiquetés
au moyen du format UMF afin d'indiquer quelle action effectuer sur chacun au cours du traitement par le système.
- Segment
- Nom du segment UMF où l'exception est survenue.
- Balise UMF
- Valeur de la balise UMF qui a provoqué l'exception UMF.
- Exception
- ID de message ou autre code indiquant le type d'exception UMF
survenu et renseignant sur la manière de remédier à cette exception. Cette
information est également disponible dans la table UMF_EXCEPT.
- Nombre d'exceptions de segment
- Nombre total de ce type d'exception UMF.
- Vérifiez le pourcentage inutilisable à la section Récapitulatif qualitatif pour savoir
si un type de données concordant est signalé comme étant de qualité médiocre ou inutilisable. Si le problème provient
d'un format UMF incorrect, le nombre Pourcentage inutilisable de la
section Récapitulatif qualitatif et le nombre d'exceptions de segment de la section Exceptions UMF
concordent généralement pour le même segment UMF et les mêmes balises UMF.