La standardisation et uniformisation d'adresse est le processus par pipeline qui normalise et homogénéise les informations d'adresse afin de corriger des erreurs et transpositions éventuelles et de préparer la fiche d'identité en vue d'un traitement de résolution d'entité optimal.
Dans le cadre du processus de standardisation d'adresse, les pipelines effectuent une analyse syntaxique et standardisent les informations de l'adresse. Par exemple, Street par St ou 123-A Main St par 123 Main St Apt A.
Ce processus par pipeline compare également les informations nouvelles ou modifiées à une base de données globale et à un logiciel de standardisation d'adresse fourni par IBM InfoSphere QualityStage ou par un autre produit de standardisation d'adresse, comme l'application CODE-1 de Group 1 Software. Le produit de standardisation d'adresse choisi détermine si les informations d'adresse sont correctement formatées, détecte et corrige les éventuelles fautes d'orthographe (dans les noms de rue par exemple), et rectifie toute information manquante ou erronée (par exemple en conformant le nom de la localité au code postal et à l'adresse).
Le tableau suivant montre des exemples de nettoyage et uniformisation, de l'adresse originale à l'adresse corrigée standardisée.
Adresse originale | Adresse standardisée |
---|---|
460 Oak Street Mill Valleu, CA 94914 |
460 South Oak Street Mill Valley, CA 94914 |
4737 Simeron Drive Easton, MA 02334 |
4737 Cimmeron Drive Easton, MA 02334 |
Le processus de standardisation et d'uniformisation d'adresse conserve à la fois l'adresse d'origine et l'adresse corrigée, améliorant ainsi le niveau de fiabilité de la résolution d'entité et de la détection de relations ultérieures. En outre, la conservation de ces informations fournit au système des données historiques de meilleure qualité.