Adressbereinigung und -standardisierung ist der Pipelineprozess, der Adressinformationen normalisiert und standardisiert, um mögliche Fehler und Verdreher zu beheben und den Identitätsdatensatz auf optimale Entitätsauflösungsverarbeitung vorzubereiten.
Im Rahmen der Adressbereinigung analysieren und standardisieren die Pipelines Adressinformationen. Beispielsweise wird Street in St oder 123-A Main St in 123 Main St Apt A umgesetzt.
Dieser Pipelineprozess prüft auch neue oder geänderte Informationen mit Hilfe einer globalen Adressdatenbank und Standardisierungssoftware, die von dem Produkt IBM InfoSphere QualityStage oder von einem anderen Adressbereinigungsprodukt wie Group 1 Software CODE-1 bereitgestellt wird. Das ausgewählte Adressbereinigungsprodukt ermittelt, ob die Adressinformationen ordnungsgemäß formatiert sind, korrigiert festgestellte Rechtschreibfehler (wie falsch geschriebene Straßennamen) und korrigiert fehlende oder falsche Informationen (es aktualisiert z. B. den Ortsnamen, damit er mit der Postleitzahl und der Adresse übereinstimmt).
In der folgenden Tabelle werden Beispiele für Adressbereinigung und -standardisierung von der Originaladresse zur korrigierten standardisierten Adresse aufgelistet.
Originaladresse | Standardisierte Adresse |
---|---|
460 Oak Street Mill Valleu, CA 94914 |
460 South Oak Street Mill Valley, CA 94914 |
4737 Simeron Drive Easton, MA 02334 |
4737 Cimmeron Drive Easton, MA 02334 |
Der Pipelineprozess zur Adressbereinigung und -standardisierung behält beide Originaladressen sowie die korrigierten und erweiterten Adressen bei, um die Übereinstimmungswahrscheinlichkeit späterer Entitätsauflösung und Beziehungserkennung zu steigern. Durch die Beibehaltung dieser Informationen werden auch bessere Langzeitinformationen bereitgestellt.