Während der Pipelineverarbeitung werden Namen bereinigt und standardisiert, um den Identitätsdatensatz auf optimale Entitätsauflösung vorzubereiten.
Pipelineprozesse stellen die genauesten Namensinformationen zu Entitäten zur aktuellen, zukünftigen und Langzeitverwendung bereit. Wenn neue oder geänderte Identitätsnamensdaten in das System aufgenommen werden, werden sie mit dem Standardisierungsverzeichnis für Produktnamen verglichen, das eine Liste mit Stammnamen und ihren bekannten Derivaten enthält, um den Stammnamen zu ermitteln. Wenn der Stammname angegeben wird, speichert das System diesen Stammnamen und den ursprünglichen Namen für den ankommenden Identitätsdatensatz.
In der folgenden Tabelle werden zwei Beispiele möglicher Derivate desselben Stammnamens einschließlich verschiedener Schreibweisen angezeigt. Die Namen auf der linken Seite sind Derivate des Stammnamens auf der rechten Seite.
Derivate | Stammname |
---|---|
Dick, Dickie, Ricardo Rich, Richie, Rick Rickey, Ricki, Rickie Ricky, Rikki, Ritchie |
Richard |
Mohamad, Mohammad Mohamed, Mohammed |
Mohammad |
Der Prozess für Namensbereinigung und -standardisierung korrigiert auch Rechtschreibfehler, falls erforderlich. Das System speichert die ursprüngliche Schreibweise und vorgenommene Korrekturen als Teil des Datensatzes. Bei den meisten anderen Systemen (einschließlich ETL- und Datenbank-Marketing-Tools) ist dies nicht der Fall.
Namensbereinigung und -standardisierung sind ein wichtiger Schritt, um die Übereinstimmungswahrscheinlichkeit der Entitätsauflösung zu steigern. Dieser Prozess ist besonders wichtig, weil die durchschnittliche Person im anglo-amerikanischen Umfeld bis zu fünf verschiedene Versionen ihres Namens für offizielle Zwecke und Verbraucherzwecke verwendet.