IM Relationship Resolution-Informationszentrale Version 4.2

Dienstprogramm Net Change

Das Dienstprogramm Net Change ist ein Java-basiertes Tool, das neue, ankommende Daten mit vorhandenen Daten derselben Quelle vergleicht.

Das Dienstprogramm prüft ankommende Datensätze anhand einer vorhandenen Datenmenge, um festzustellen, ob jeder ankommende Datensatz Folgendes darstellt:

Verwenden Sie das Dienstprogramm Net Change jedes Mal, wenn ankommende Daten Daten wiederholen, über die Sie bereits verfügen. Beispiel: Wenn es sich bei einer Ihrer monatlichen Datenquellenzuführungen um eine Datenquelle mit einem Telefonverzeichnis handelt, ist es sinnvoll, die neuen Daten vor dem Laden auf Duplikate zu überprüfen, da Telefonnummern in der Regel nicht monatlich gewechselt werden.

Wenn Sie doppelte Datensätze eliminieren, brauchen diese nicht vom Konvertierungsdienstprogramm oder von Pipelines verarbeitet zu werden, wodurch die gesamte Systemverarbeitungszeit reduziert werden kann.

Die Einstellungen in der Konfigurationsdatei beschreiben Laufzeitparameter, die für das Vergleichen von Datensätzen unabdingbar sind. Damit das Dienstprogramm Net Change erfolgreich ist, sind präzise Einstellungen für die Definition von Datensatzbreite, Datensatzkriterien und Datensatzschlüssel erforderlich. Wenn z. B. die Gesamtdateigröße nicht durch Datensatzlänge plus Länge der Füllzeichen teilbar ist, zeigt das Dienstprogramm Net Change einen Fehler an und stoppt.

Das Dienstprogramm Net Change vergleicht eine ankommende Satzgruppe mit einer vorhandenen Basissatzgruppe. Es erstellt eine Differenzdatei (.dif), die angibt, welche Datensätze einen hinzugefügten, geänderten, gelöschten oder bereits vorhandenen (Seen) Datensatz darstellen. Das Dienstprogramm erstellt eine Zusammenfassungsdatei (.merge), die die ursprüngliche Basissatzgruppe überschreibt und als nächste Basissatzgruppe verwendet wird. Das Dienstprogramm Net Change kann die Differenzdatei dann an das UMF-Dateikonvertierungsdienstprogramm bzw. an ein anderes UMF-Generierungsdienstprogramm oder, wenn die Datenquelle die Datensätze im UMF-Format bereitstellt, direkt an eine Pipeline senden.

Das Dienstprogramm Net Change führt zwei Arten von Vergleichen aus:

  1. Inkrementell: (Standard) Verwenden Sie einen inkrementellen Vergleich, wenn die Gruppen ankommender Daten unvollständig sind, wenn z. B. an einem Tag nur Datensätze von A - M und am folgenden Tag Datensätze von N - Z geladen werden. Auf diese Weise ziehen die ankommenden Daten während der Verarbeitung von Datensätzen von A - M keine Änderungen Ihrer Datensätze von N - Z in der Basisdatei nach sich. Für inkrementelle Vergleiche gilt Folgendes:
    • Datensätze, die verglichen mit der Basisdatei in der Quellendatei fehlen, werden ignoriert.
    • In der Differenzdatei (.diff) werden keine Datensätze zum Löschen markiert, und es werden keine Datensätze aus der neuen Basisdatei gelöscht.
    • Hierbei dürfen Sie den Schalter --do-delete nicht in der Befehlszeile angeben.
  2. Vollständiger Vergleich: Verwenden Sie den vollständigen Vergleich, wenn die ankommenden Daten jedes Mal alle Datensätze einer Datenmenge bereitstellen und Sie alle Datensätze, die in der Datenbank, aber nicht in den Eingabedaten vorhanden sind, löschen wollen. Für vollständige Vergleiche gilt Folgendes:
    • Die gesamten Eingabedaten werden anhand der gesamten Basisdatei ausgewertet.
    • Alle Datensätze, die in der Quelle fehlen (verglichen mit der Basisdatei) werden markiert. Zum Löschen markierte Datensätze werden aus der neuen Basisdatei gelöscht.
    • Sie müssen dies in der Befehlszeile angeben, indem Sie den Schalter --do-delete verwenden.
Zugehörige Tasks
Auswerten neuer Daten anhand vorhandener Daten
Zugehörige Verweise
Datensatzvergleich des Dienstprogramms Net Change


Feedback

Letzte Aktualisierung: 2007