IM Relationship Resolution-Informationszentrale Version 4.2

Auswerten neuer Daten anhand vorhandener Daten

Wenn Sie über große Datenmengen verfügen, die regelmäßig aktualisiert werden, können Sie mit dem Dienstprogramm Net Change Datensätze identifizieren, die hinzugefügt, geändert oder gelöscht wurden. Nach dem Identifizieren dieser Datensätze können Sie Verarbeitungszeit sparen, indem Sie nur die geänderten Datensätze an die Pipeline senden.

Vorbereitung:
Stellen Sie sicher, dass alle Quellendateien Dateien mit feststehender Breite sind.
Vorgehensweise:
  1. Sortieren Sie die ankommende Datendatei nach dem Schlüssel, der jeden Datensatz eindeutig angibt. (Dies ist kritisch für den Erfolg.)
  2. Führen Sie das Dienstprogramm Net Change aus.
    java -server -jar jnce.jar --cfg-file=dateiname.ini
     --base-file=dateiname.base --new-file=eingabedatei
     --out-root=dateiname
    Anmerkung: Diese Befehlszeile ist umbrochen.
  3. Wenn nach diesem Schritt ein Fehler auftritt:
    1. Beheben Sie die Fehlerursache.
    2. Löschen Sie die .diff- und .merge-Dateien.
    3. Führen Sie das Dienstprogramm Net Change erneut aus.
  4. Überprüfen Sie, ob die Ergebnisse sinnvoll sind:
    1. Überprüfen Sie die Daten visuell.
    2. Überprüfen Sie die Anzahl Datensätze. Wenn Sie z. B. 1 Million Datensätze hatten und nach der Ausführung des Dienstprogramms Net Change 100.000 erwarten, stellen Sie sicher, dass die tatsächliche Anzahl Datensätze mit der erwarteten Anzahl übereinstimmt.
  5. Archivieren Sie die alte Basisdatei, und benennen Sie die neue .merge-Datei um, damit diese nun als neue Basisdatei verwendet wird.
Weitere Schritte:
Sie haben jetzt doppelte und unveränderte Datensätze eliminiert und können lediglich jene Datensätze, die von der Pipeline verarbeitet werden müssen, an ein UMF-Generierungsdienstprogramm oder (wenn diese Datensätze die UMF-Anforderungen erfüllen) direkt an die Pipeline senden.
Zugehörige Konzepte
Dienstprogramm Net Change
Zugehörige Verweise
Datensatzvergleich des Dienstprogramms Net Change
Konfigurationsdateiparameter für das Dienstprogramm Net Change


Feedback

Letzte Aktualisierung: 2007