A limpeza e a padronização de endereço é o processo de pipeline que normaliza e padroniza informações de endereço para corrigir possíveis erros e transposições e para preparar o registro de identidade para processamento otimizado da resolução de entidade.
Como parte do processo de limpeza de endereço, os pipelines analisam e padronizam as informações de endereço. Por exemplo, Street como St ou 123-A Main Stcomo 123 Main St Apt A.
Este processo de pipeline também verifica informações novas ou alteradas em um software global de banco de dados e padronização de endereço fornecido pelo produto IBM InfoSphere QualityStage ou por outro produto de limpeza de endereço, como o produto CODE-1 de Software do Grupo 1. O produto de limpeza de endereço escolhido determina se as informações de endereço estão formatadas corretamente, corrige erros de digitação detectados (como nomes de ruas digitados incorretamente) e corrige informações ausentes ou incorretas (como atualização do nome da cidade para corresponder ao código de endereçamento postal e endereço).
Por exemplo, a tabela a seguir mostra exemplos de limpeza e padronização de endereço do endereço original para o endereço correto, padronizado.
Endereço original | Endereço padronizado |
---|---|
460 Oak Street Mill Valleu, CA 94914 |
460 South Oak Street Mill Valley, CA 94914 |
4737 Simeron Drive Easton, MA 02334 |
4737 Cimmeron Drive Easton, MA 02334 |
O processo de pipeline de limpeza e padronização de endereço retém o endereço original, bem como o endereço corrigido e aprimorado, para melhorar os níveis de confiabilidade da resolução de entidade e detecção de relacionamento posteriores. A retenção destas informações também fornece melhores informações históricas.