IM InfoSphere Identity Insight Version 8.0

Namensbereinigung und -standardisierung

Während der Pipelineverarbeitung werden Namen bereinigt und standardisiert, um den Identitätsdatensatz auf optimale Entitätsauflösung vorzubereiten.

Pipelineprozesse stellen die genauesten Namensinformationen zu Entitäten zur aktuellen, zukünftigen und Langzeitverwendung bereit. Wenn neue oder geänderte Identitätsnamensdaten in das System aufgenommen werden, werden sie mit dem Standardisierungsverzeichnis für Produktnamen verglichen, das eine Liste mit Stammnamen und ihren bekannten Derivaten enthält, um den Stammnamen zu ermitteln. Wenn der Stammname angegeben wird, speichert das System diesen Stammnamen und den ursprünglichen Namen für den ankommenden Identitätsdatensatz.

In der folgenden Tabelle werden zwei Beispiele möglicher Derivate desselben Stammnamens einschließlich verschiedener Schreibweisen angezeigt. Die Namen auf der linken Seite sind Derivate des Stammnamens auf der rechten Seite.

Tabelle 1. Beispiele möglicher Derivate für die Stammnamen Richard und Mohammad
Derivate Stammname

Dick, Dickie, Ricardo

Rich, Richie, Rick

Rickey, Ricki, Rickie

Ricky, Rikki, Ritchie

Richard

Mohamad, Mohammad

Mohamed, Mohammed

Mohammad

Der Prozess für Namensbereinigung und -standardisierung korrigiert auch Rechtschreibfehler, falls erforderlich. Das System speichert die ursprüngliche Schreibweise und vorgenommene Korrekturen als Teil des Datensatzes. Bei den meisten anderen Systemen (einschließlich ETL- und Datenbank-Marketing-Tools) ist dies nicht der Fall.

Namensbereinigung und -standardisierung sind ein wichtiger Schritt, um die Übereinstimmungswahrscheinlichkeit der Entitätsauflösung zu steigern. Dieser Prozess ist besonders wichtig, weil die durchschnittliche Person im anglo-amerikanischen Umfeld bis zu fünf verschiedene Versionen ihres Namens für offizielle Zwecke und Verbraucherzwecke verwendet.



Feedback

Letzte Aktualisierung: 2009