Le rapport Récapitulatif de chargement récapitule les statistiques et les caractéristiques de qualité par source de données. Il contient des informations sur les fichiers sources de données. Utilisez ce rapport pour déterminer les statistiques de chargement, le nombre de résolutions d'entité
et d'alertes générées par ce chargement, les informations générales sur
la qualité des données des données chargées, un récapitulatif des actions concernant les fiches UMF par chargement, et toutes les exceptions UMF générées par chargement. Le rapport est trié par ID de chargement.
Pour chaque chargement, le rapport décompose les statistiques en sections :
- Récapitulatif de chargement
- Récapitulatif d'alerte de rôle
- Récapitulatif des relations
- Récapitulatif qualitatif
- Récapitulatif de document UMF
- Récapitulatif des exceptions
Récapitulatif du chargement
Utilisez cette section pour vous aider à déterminer le temps qui a été nécessaire au traitement d'un fichier spécifique, et vous donner une idée générale de l'utilité de ce fichier de source de données dans la résolution d'entité et la détection de relation.
- Date et heure de démarrage
- Indique la date et l'heure du début de chargement des données.
- Date et heure de fin
- Indique la date et l'heure de fin du chargement du fichier de source de données.
- Nombre de fiches UMF
- Indique le nombre total de fiches chargées depuis ce fichier de source de données dans l'intervalle Date et heure de début et Date et heure de fin.
- La valeur de la Date et heure de fin moins la valeur de la Date et heure de début correspond au nombre de minutes nécessaires au chargement de ce fichier de source de données, ce qui vous donne une idée des performances du système. Cela peut également indiquer qu'un fichier de source de données plus volumineux doit être scindé en fichiers plus petits pour accélérer le traitement.
- Nouvelles identités
- Indique le nombre total de nouvelles identités chargées dans l'intervalle Date de début et Date de fin.
- % de nouvelles identités
- Indique le pourcentage de nouvelles identités sur le total des identités de ce chargement de données (identités nouvelles dans la base de données d'entités).
- Nouvelles entités
- Indique le nombre total d'entités nouvellement créées dans l'intervalle Date de début et Date de fin.
- % de nouvelles entités
- Indique, sur le total d'entités, le pourcentage d'entités nouvellement créées suite à ce chargement de source de données.
- Le nombre de nouvelles identités et de nouvelles entités peut vous procurer une idée
générale de l'intérêt global de cette source de données en termes de résolution d'entité et
de détection de relation. Si ces chiffres sont faibles et restent faibles sur le long terme, il se peut que cette source de données ne soit pas utile pour atteindre les objectifs de résolution d'entité de votre entreprise.
Récapitulatif d'alerte de rôle
Utilisez cette section pour consulter les règles
et scores de résolution communs aux relations détectées qui ont débouché
sur des alertes de rôle. Chaque ligne représente le nombre d'alertes de rôle qui ont été générées,
selon les critères mentionnés.
- Règle de résolution
- Affiche le nom de la règle de résolution utilisée pour évaluer l'identité et l'entité pendant la résolution d'entité et la détection de relation.
- Description d'alerte
- Affiche le nom de la règle d'alerte de rôle qui a déclenché l'alerte de rôle.
- Gravité
- Affiche un indicateur défini par l'utilisateur, servant à mesurer la priorité ou l'importance de cette alerte de rôle.
- Score de résolution
- Affiche un score de résolution (0-100) pour la règle de résolution donnée à l'identité et à l'entité impliquées dans l'alerte de rôle. Ce score indique le degré de ressemblance entre l'identité et
l'entité.
Un score de 100 signifie que la fiche d'identité a été résolue sous la forme de l'entité.
- Nombres d'alertes
- Indique le nombre total d'alertes de rôle générées sur la base de la description de la règle d'alerte de rôle, la règle de résolution et le score de résolution.
Récapitulatif des relations
Cette section permet de consulter les
attributs communs aux relations détectées qui n'ont pas déclenché d'alerte de
rôle. Chaque ligne représente le nombre de relations qui ont été détectées,
selon les critères mentionnés.
- Règle de résolution
- Affiche le nom de la règle de résolution utilisée pour évaluer les fiches d'identité entrantes et les entités existantes pendant la résolution d'entité et la détection de relation.
- Score de résolution
- Affiche un score de résolution (0-100) pour la règle de résolution donnée à l'identité et à l'entité pendant la résolution d'entité. Ce score indique le degré de ressemblance entre l'identité et
l'entité. Un score de 100 signifie que la fiche d'identité a été résolue sous la forme de l'entité.
- Score de relation
- Affiche un score de relation (0-100) pour la règle de résolution donnée à l'identité et à l'entité pendant la résolution de relation. Ce score indique le degré de relation entre l'identité et
l'entité.
- Plus le score de relation est élevé,
plus l'identité et l'entité sont étroitement apparentées,
selon les attributs concordants.
- Nombre de relations
- Indique le nombre total de relations détectées sur la base de cette règle de résolution, du score de résolution et du score de relation.
Récapitulatif de la qualité
Consultez les informations de cette section
pour évaluer la qualité des données de chaque fichier source.
Cette section
indique la qualité par type d'attribut au sein d'un type de segment UMF et de document
UMF. En consultant le récapitulatif qualitatif avec celui des exceptions UMF, vous pouvez savoir
quels fichiers sources de données posent des problèmes de qualité ou d'UMF défectueux qu'il importe
de régler. Vous pouvez généralement remédier à ces problèmes via la configuration ETL
ou DQM/de source de données avant de traiter le fichier de source de données.
Dans
certains cas, cette section peut révéler qu'une source de données est de qualité
si médiocre qu'il ne faudrait plus l'utiliser pour la résolution d'entité.
- Type de document
- Affiche le nom du type de document UMF qui contient le type de données mentionné dans le Type de données. Cette valeur est généralement UMF_ENTITY.
- Nom de la table
- Affiche le nom de la table de base de données qui conserve les données provenant de segments UMF ayant le même nom. Par exemple, les données provenant du segment NUMBER sont stockées dans la table NUMS.
- Type de données
- Indique le type de données, tel que mentionné dans les balises UMF de type d'attribut des fiches entrantes. Ce type correspond à un segment UMF figurant dans le nom de table. Par exemple,
si le nom de table est ADDRESS et que le type de données mentionné
est H, les informations qualitatives évaluent le
type d'adresse Domicile.
- Si vous ne reconnaissez pas un type de données, vous pouvez indiquer que le fichier de source de données n'est pas correctement mappé à la combinaison de documents, segments et balises UMF. Vérifiez dans la section de récapitulatif des exceptions si un
segment UMF et une balise UMF concordants ont provoqué des exceptions de segment. Si le problème provient d'un UMF invalide, les chiffres du Pourcentage inutilisable de la section Récapitulatif qualitatif et le Nombre d'exceptions de segment dans la section des exceptions UMF sont généralement concordants.
- Nombre de fiches
- Indique le nombre total de fiches d'identité entrantes pour le Type de document, le Nom de table et le Type de données spécifiés.
- Nombre générique
- Indique le nombre total de fiches d'identité entrantes avec le Type de document, le Nom de table et le Type de données spécifiés dont les valeurs sont considérées comme génériques.
- Pourcentage inutilisable
- Indique le nombre total de fiches d'identité entrantes avec le Type de document, le Nom de table et le Type de données spécifiés qui sont considérées comme inutilisables. Ce nombre peut révéler un problème de saisie de
données ou de transformation ETL dans le fichier de source de données.
- Pourcentage utilisable
- Indique le pourcentage de fiches d'identité entrantes avec le Type de document, le Nom de table (de ce segment UMF) et le Type de données spécifiés comme utilisables pour la résolution d'entité et la détection de relation.
(Nombre de fiches moins le Nombre générique moins le Pourcentage inutilisable) divisé par le Nombre de fiches équivaut au Pourcentage utilisable.
- Pourcentage d'identité
- Indique le pourcentage de fiches d'identité entrantes qui contenaient le type de document, le nom de table et le type de données spécifiés.
Récapitulatif d'attribut
Cette section permet de consulter dans le fichier de source de données les attributs
qui ont contribué à détecter les relations et à déclencher
des alertes de rôle. Chaque attribut est associé à un segment UMF spécifique, et cette section
montre le nombre de relations détectées et d'alertes de rôle déclenchées, selon les
données présentes dans le segment UMF entrant.
- Nom du segment
- Affiche le nom du segment UMF qui correspond directement à un attribut.
- Type de données
- Mentionne le type d'attribut (ou type de données), au sein du segment UMF, qui correspond
à la description de la précision. Il se peut que le rapport mentionne soit un type d'attribut particulier,
soit TOUS, ce qui indique tous les types d'attribut du segment
UMF.
- Description de précision
- Décrit le seuil de concordance entre un attribut d'une entité entrante et un attribut d'une entité existante.
- Alertes de rôle
- Indique le nombre total d'alertes de rôle générées sur ce segment UMF, ce type de données, et cette description de précision.
- Relations
- Indique le nombre total de relations détectées sur ce segment UMF, ce type de données et cette description de précision
Récapitulatif des documents UMF
Vous pouvez utiliser cette section pour valider le nombre total de fiches entrantes dans un fichier de source de données, en fonction de l'action qui doit être effectuée sur la fiche. Vous pouvez réconcilier ces nombres en Nombre de fiches dans la section Récapitulatif de chargement.
- Type de document
- Affiche le nom du type de document UMF. Cette valeur est généralement UMF_ENTITY.
- Action
- Indique le type d'action pour la fiche d'identité entrante :
- A : ajout
- C : modification
- D : suppression
- Dans le cadre du processus ETL (extraction, transformation et chargement), les fiches d'identité sont généralement étiquetées
au moyen du format UMF afin d'indiquer quelle action effectuer sur chacun au cours du traitement par le système.
- Nombre de fiches UMF
- Indique le nombre total de fiches traitées pour chaque type d'action dans un type de document.
- Pourcentage
- Indique le pourcentage du total des fiches chargées représenté par le Nombre de fiches. (la somme ne doit pas dépasser 100%).
Récapitulatif des exceptions
Ces informations aident à
repérer les fiches d'identité erronées, telles que celles dont le format UMF est syntaxiquement incorrect.
L'exception décrit
le problème, tandis que le nom de table et l'élément indiquent les segments et fiches défectueuses. Le comptage montre combien de fiches du fichier comportaient ce
format UMF incorrect.
- Type de document
- Affiche le nom du type de document UMF. Cette valeur est généralement UMF_ENTITY.
- Action
- Indique le type d'action pour la fiche d'identité entrante :
- A : ajout
- C : modification
- D : suppression
Dans le cadre du processus ETL (extraction, transformation et chargement), les fiches d'identité sont généralement étiquetées
au moyen du format UMF afin d'indiquer quelle action effectuer sur chacun au cours du traitement par le système.
- Segment
- Affiche le nom du segment UMF sur lequel l'exception s'est produite.
- Balise UMF
- Affiche la valeur de la balise UMF qui a provoqué l'exception UMF.
- Exception
- Affiche l'ID de message ou autre code d'exception indiquant le type d'exception UMF qui s'est produite et donne des informations sur la manière de résoudre cette exception. Cette
information est également disponible dans la table UMF_EXCEPT.
- Nombre d'exceptions de segment
- Indique le nombre total de ce type d'exception UMF.
- Vérifiez le pourcentage inutilisable à la section Récapitulatif qualitatif pour savoir
si un type de données concordant est signalé comme étant de qualité médiocre ou inutilisable. Si le problème provient
d'un format UMF incorrect, le nombre Pourcentage inutilisable de la
section Récapitulatif qualitatif et le nombre d'exceptions de segment de la section Exceptions UMF
concordent généralement pour le même segment UMF et les mêmes balises UMF.