La gestion de la qualité des données (DQM) désigne le processus de pipeline qui vérifie dans les données si les valeurs obligatoires, les types de données valides et les codes valides sont présents. Vous pouvez également configurer la DQM de façon à corriger les données en fournissant des valeurs par défaut, en formatant les numéros et dates et en ajoutant de nouveaux codes.
La gestion de la qualité des données, de même que la standardisation et uniformisation des noms et adresses, vise à optimiser et perfectionner la qualité des données. Cette préparation de la qualité des données est une étape essentielle de la résolution d'entité, car elle accroît la fiabilité des entités résolues et relations détectées qui en résultent.
Pour appliquer la gestion de la qualité aux données chargées dans le système, il faut configurer des règles de gestion de la qualité des données (ou règles DQM). Les règles DQM peuvent accomplir toute une palette d'opérations de réparation, nettoyage et standardisation sur les valeurs de données d'identité entrantes, notamment en formatant convenablement les numéros, en repérant et rectifiant les coquilles ou erreurs de transposition, ainsi qu'en repérant et rectifiant les inexactitudes délibérées introduites par les personnes soucieuses de dissimuler leur identité.
Ce produit est préconfiguré d'origine avec plusieurs règles DQM par segment UMF et qui remédient aux problèmes de qualité de données les plus typiques de ce segment UMF. Vous pouvez néanmoins configurer des règles DQM supplémentaires, au gré des besoins. Toutefois, avant d'y procéder, vous devez être familiarisé avec la qualité originale des données et avec le processus ETL (extraction, transformation et chargement) qui a servi à convertir les données identitaires en UMF. Une fois que vous savez quelle amélioration des données s'impose, vous pouvez sélectionner les règles DQM, fonctions et valeurs adéquates à appliquer à chaque type de données identitaires nécessitant une optimisation plus poussée.
Supposons par exemple que le format de date de votre système soit JJ/MM/AAAA. Par contre, dans plusieurs de vos sources de données, les dates sont au format MM-JJ-AAAA. Vous pouvez alors ajouter la règle DQM 204 au segment UMF <NUMBER>, en le configurant ainsi de façon à convertir au format de date JJ/MM/AAAA toutes les dates entrantes formatées en MM-JJ-AAAA.