Le rapport Récapitulatif de chargement récapitule les statistiques et les caractéristiques de qualité par source de données. Il contient des informations sur les fichiers sources de données. Il
vous permet de déterminer les statistiques de charge pour les performances, le
nombre d'entités et d'alertes créées par chargement, des informations générales sur
la qualité des données chargées, un récapitulatif des actions relatives aux
fiches UMF par chargement et toutes les exceptions UMF générées par
chargement. Le rapport est organisé par ID chargement.
Pour chaque chargement, le rapport divise les statistiques en plusieurs
sections :
- Récapitulatif de chargement
- Récapitulatif d'alerte de rôle
- Récapitulatif des relations
- Récapitulatif qualitatif
- Récapitulatif de document UMF
- Récapitulatif des exceptions
Récapitulatif de chargement
Cette section vous permet de
déterminer le temps de traitement d'un fichier particulier et vous donne une idée
sur l'utilité de ce fichier de source de données en termes de résolution d'entité
et de détection de relations.
- Date et heure de démarrage
- Indique la date et l'heure auxquelles le chargement des données a commencé.
- Date et heure de fin
- Indique la date et l'heure auxquelles le chargement du fichier de source de
données a terminé.
- Nombre d'fiches UMF
- Indique le nombre total de fiches chargées à partir de ce fichier de
source de données dans la plage Date et heure de démarrage
et Date et heure de fin.
- Le nombre Date et heure de fin moins le nombre
Date et heure de démarrage correspond au nombre de minutes
que dure le chargement de ce fichier de source de données, ce qui vous donne un idée
des performances système. Il peut aussi indiquer qu'un fichier de source de données
plus volumineux doit être divisé en fichiers plus petits pour accélérer le
traitement.
- Nouvelles identités
- Indique le nombre total de nouvelle identités chargées dans la plage
Date et heure de démarrage et Date et heure de
fin.
- % de nouvelles identités
- Indique le pourcentage du total des identités dans ce chargement de
données qui correspondent à de nouvelles identités (dans la base de données
d'entité).
- Nouvelles entités
- Indique le nombre total d'entités créées dans la plage Date et heure
de démarrage et Date et heure de fin.
- % de nouvelles entités
- Indique le pourcentage du total d'entités qui sont des entités nouvellement
créées suite au chargement de cette source de données.
- Le nombre de nouvelles identités et de nouvelles entités peut vous procurer une idée
générale de l'intérêt global de cette source de données en termes de résolution d'entité et
de détection de relation. Si ces nombres sont inférieurs et restent bas, cette
source de données ne sert éventuellement pas à atteindre les objectifs de
résolution d'entité de votre entreprise.
Récapitulatif d'alerte de rôle
Utilisez cette section pour consulter les règles
et scores de résolution communs aux relations détectées qui ont débouché
sur des alertes de rôle. Chaque ligne représente le nombre d'alertes de rôle qui ont été générées,
selon les critères mentionnés.
- Règle de résolution
- Affiche le nom de la règle de résolution servant à évaluer l'identité et
l'entité pendant la résolution d'entité et la détection de relations.
- Description d'alerte
- Affiche le nom de la règle d'alerte de rôle ayant déclenché l'alerte de
rôle.
- Gravité
- Affiche un indicateur défini par l'utilisateur pour mesurer la priorité ou
importance de cette alerte de rôle.
- Score de résolution
- Affiche un score de résolution (0-100) pour la règle de résolution attribué à
l'identité et à l'entité impliquées dans l'alerte de rôle. Ce score indique le degré de ressemblance entre l'identité et
l'entité.
Un score de 100 signifie que la fiche d'identité a été résolue sous la forme de l'entité.
- Nombres d'alertes
- Indique le nombre total d'alertes de rôle générées à partir de la description de
la règle d'alerte de rôle, de la règle de résolution et du score de résolution.
Récapitulatif des relations
Cette section permet de consulter les
attributs communs aux relations détectées qui n'ont pas déclenché d'alerte de
rôle. Chaque ligne représente le nombre de relations qui ont été détectées,
selon les critères mentionnés.
- Règle de résolution
- affiche le nom de la règle de résolution utilisé pour évaluer les
fiches d'identité entrantes et les entités existantes lors de la résolution
d'entité et la détection de relations.
- Score de résolution
- Affiche un score de résolution (0-100) pour la règle de résolution attribué à
l'identité et à l'entité pendant la résolution d'entité. Ce score indique le degré de ressemblance entre l'identité et
l'entité. Un score de 100 signifie que la fiche d'identité a été résolue sous la forme de l'entité.
- Score de relation
- Affiche un score de relation (0-100) pour la règle de résolution attribué à
l'identité et à l'entité pendant la résolution de relation. Ce score indique le degré de relation entre l'identité et
l'entité.
- Plus le score de relation est élevé,
plus l'identité et l'entité sont étroitement apparentées,
selon les attributs concordants.
- Nombre de relations
- Indique le nombre total de relations détectées selon la règle de
résolution, le score de résolution et le score de relation.
Récapitulatif qualitatif
Consultez les informations de cette section
pour évaluer la qualité des données de chaque fichier source.
Cette section
indique la qualité par type d'attribut au sein d'un type de segment UMF et de document
UMF. En consultant le récapitulatif qualitatif avec celui des exceptions UMF, vous pouvez savoir
quels fichiers sources de données posent des problèmes de qualité ou d'UMF défectueux qu'il importe
de régler. Vous pouvez généralement remédier à ces problèmes via la configuration ETL
ou DQM/de source de données avant de traiter le fichier de source de données.
Dans
certains cas, cette section peut indiquer qu'une source de données est d'une
qualité si faible que vous ne devez pas l'utiliser pour la résolution d'entité.
- Type de document
- Affiche le nom du type de document UMF contenant le type de données figurant
dans la zone Type de données. Cette valeur est en général UMF_ENTITY.
- Nom de la table
- Affiche le nom de la table de base de données stockant des données à
partir de segments UMF de nom similaire. Par exemple, les données du segment
NUMBER sont stockées dans la table NUMS.
- Type de données
- Indique le type de données, comme répertorié dans les balises UMF du type
d'attribut des fiches entrantes. Ce type correspond à un segment UMF figurant dans le nom de table. Par exemple,
si le nom de table est ADDRESS et que le type de données mentionné
est H, les informations qualitatives évaluent le
type d'adresse Domicile.
- Si vous ne reconnaissez pas un type de données, il se peut que le
fichier de source de données ne soit pas correctement associé à la combinaison
adéquate de documents, segments et balises UMF. Vérifiez dans la section de récapitulatif des exceptions si un
segment UMF et une balise UMF concordants ont provoqué des exceptions de segment. Si le problème provient d'un format UMF non valide, le nombre Pourcentage
inutilisable de la section Récapitulatif qualitatif et le nombre d'exceptions de segment de la section
Exceptions UMF concordent généralement.
- Nombre de fiches
- Indique le nombre total de fiches d'identité entrantes pour le
type de document, le nom de table et le type de données indiqués.
- Nombre générique
- Indiquez le nombre total de fiches d'identité entrantes avec le type
de document, le nom de table et le type de données indiqués, et qui contiennent des
valeurs considérées génériques.
- Pourcentage inutilisable
- Indique le nombre total de fiches d'identité entrantes avec le type de
document, le nom de table et le type de données indiqués, et considérés de faible
qualité. Ce nombre peut désigner un problème de saisie de données ou de
transformation ETL dans le fichier de source de données.
- Pourcentage utilisable
- Indique le pourcentage de fiches d'identité entrantes avec le type
de document, le nom de table (de ce segment UMF) et le type de données indiqués, et
qui peuvent servir pour la résolution d'entité et la détection de relations.
(Nombre de fiches moins Nombre générique moins Nombre de faible qualité)
divisé par
Nombre de fiches = Pourcentage utilisable.
- Pourcentage d'identité
- Indique le pourcentage de fiches d'identité entrantes contenant le
type de document, le nom de table et le type de données indiqués.
Récapitulatif d'attribut
Cette section permet de consulter dans le fichier de source de données les attributs
qui ont contribué à détecter les relations et à déclencher
des alertes de rôle. Chaque attribut est associé à un segment UMF spécifique, et cette section
montre le nombre de relations détectées et d'alertes de rôle déclenchées, selon les
données présentes dans le segment UMF entrant.
- Nom du segment
- Affiche le nom du segment UMF qui s'associe directement à un attribut.
- Type de données
- Mentionne le type d'attribut (ou type de données), au sein du segment UMF, qui correspond
à la description de la précision. Il se peut que le rapport mentionne soit un type d'attribut particulier,
soit TOUS, ce qui indique tous les types d'attribut du segment
UMF.
- Description de précision
- Décrit le seuil correspondant entre un attribut d'une identité entrante et un
attribut d'une entité existante.
- Alertes de rôle
- Indique le nombre total d'alertes de rôle générées à partir de ce segment UMF,
ce type de données et la description de précision.
- Relations
- Indique le nombre total de relations détectées à partir de ce segment UMF, ce
type de données et la description de précision.
Récapitulatif de document UMF
Cette section permet de
valider le nombre total de fiches entrantes dans un fichier de source de données,
selon l'action à effectuer sur la fiche. Vous pouvez réconcilier ces nombres en Nombre de fiches dans la section Récapitulatif de chargement.
- Type de document
- Affiche le nom du type de document UMF. Cette valeur est en général UMF_ENTITY.
- Action
- Indique le type d'action pour la fiche d'identité entrante :
- A : ajout
- C : modification
- D : suppression
- Dans le cadre du processus ETL (extraction, transformation et chargement), les fiches d'identité sont généralement étiquetées
au moyen du format UMF afin d'indiquer quelle action effectuer sur chacun au cours du traitement par le système.
- Nombre de fiches UMF
- Indique le nombre total de fiches traitées pour chaque type d'action dans
le type de document.
- Pourcentage
- Indique le pourcentage du nombre total de fiches chargées que la
valeur Nombre de fiches représente. (la somme ne doit pas dépasser 100%).
Récapitulatif des exceptions
Ces informations aident à
repérer les fiches d'identité défectueuses, telles que celles dont le format UMF est syntaxiquement incorrect.
L'exception décrit
le problème, tandis que le nom de table et l'élément indiquent les segments et fiches
défectueux. Le comptage montre combien de fiches du fichier comportaient ce
format UMF incorrect.
- Type de document
- Affiche le nom du type de document UMF. Cette valeur est en général UMF_ENTITY.
- Action
- Indique le type d'action pour la fiche d'identité entrante :
- A : ajout
- C : modification
- D : suppression
Dans le cadre du processus ETL (extraction, transformation et chargement), les fiches d'identité sont généralement étiquetées
au moyen du format UMF afin d'indiquer quelle action effectuer sur chacune au cours du traitement par le système.
- Segment
- Affiche le nom du segment UMF où l'exception s'est produite.
- Balise UMF
- Affiche la valeur de la balise UMF ayant entraîné l'exception UMF.
- Exception
- Affiche l'ID message ou autre code d'exception pour indiquer le type d'exception
UMF s'étant produit et apporter des informations sur la façon de résoudre cette exception. Cette
information est également disponible dans la table UMF_EXCEPT.
- Nombre d'exceptions de segment
- Indique le nombre total de ce type d'exception UMF.
- Vérifiez le pourcentage inutilisable à la section Récapitulatif qualitatif pour savoir
si un type de données concordant est signalé comme étant de qualité médiocre ou inutilisable. Si le problème provient
d'un format UMF incorrect, le nombre Pourcentage inutilisable de la
section Récapitulatif qualitatif et le nombre d'exceptions de segment de la section Exceptions UMF
concordent généralement pour le même segment UMF et les mêmes balises UMF.