IM Relationship Resolution-Informationszentrale Version 4.2

Parameter für die Pipelinekonfigurationsdatei

Die Pipelinekonfigurationsdatei (in der Regel pipeline.ini) enthält die Anfangswerte für Variablen und Konfigurationsdaten, die Pipelines für die Verarbeitung ankommender Daten benötigen. Einstellungen in der Pipelinekonfigurationsdatei überschreiben die globalen Systemeinstellungen (wie z. B. in Systemparametern) für alle Pipelines, die dieselbe Pipelinekonfigurationsdatei verwenden.

In dieser Pipelinekonfigurationsdatei können Sie Parameter oder Werte manuell hinzufügen oder ändern. Dabei ist es jedoch möglich, dass diese Datei beschädigt wird, dass eine ungültige Konfiguration entsteht oder dass es zu Störungen bei der Pipelineverarbeitung kommt. Erstellen Sie zu Sicherungszwecken eine Kopie der Datei, bevor Sie Änderungen an der Pipelinekonfigurationsdatei vornehmen.

Parameter für den Abschnitt [pipeline]

Dieser Abschnitt enthält Konfigurationsdaten für die Pipelines. Benennen Sie diese Abschnittsüberschrift nicht um. Sie muss stets [pipeline] lauten. Andernfalls werden die Pipelines, die diese Konfigurationsdatei verwenden, mit einem Fehler abgeschaltet.

CMEAdminTransport
Gibt die HTTP-URI (Uniform Resource Identifier) für den Transport zur Konfigurationskonsole an, der Komponente, die den Anwendungsmonitor enthält. Sie können den Anwendungsmonitor verwenden, um den Pipelinestatus und Statistikdaten zu überwachen und Ergebnisse von Pipelines weiterzuleiten.
Standardmäßig wird diese Einstellung nicht angegeben. Diese Einstellung ist in der Regel auf Kommentar gesetzt.
InputTransport
Gibt die URI für die Transportquelle an, an der die Pipeline ankommende Daten empfängt. Wenn die angegebene Transportquelle nicht vorhanden ist, startet bzw. beendet das System die Pipeline nicht.
Sie können mehrere Transportquellen angeben, indem Sie die URIs mit einem Leerzeichen voneinander trennen.
Standardmäßig wird diese Einstellung nicht angegeben. In der Regel ist diese Einstellung in Kommentarzeichen gesetzt, weil Eingabetransportquellen beim Starten von Pipelines gewöhnlich in der Befehlszeile angegeben werden.
Concurrency
Gibt die Anzahl gleichzeitiger paralleler Pipelineverarbeitungsthreads an, die beim Start eines einzelnen Pipelineprozesses gestartet werden. Dieser Parameter kann jede positive ganze Zahl größer-gleich 0 sein. Je größer die Zahl ist, umso mehr Pipelineverarbeitungsthreads werden mit jedem Pipelinestartbefehl gestartet und umso mehr ankommende Datensätze können gleichzeitig verarbeitet werden. (Von jedem parallelen Verarbeitungsthread wird ein einzelner Datensatz verarbeitet.)
Diese Einstellung hat Vorrang vor der Einstellung des Systemparameters DEFAULT_CONCURRENCY, der auf der Indexzunge Systemparameter in der Konfigurationskonsole angegeben ist.
Wenn die DSE-Systemkomponente (Dynamic Scoring Engine) im Abschnitt [DSE] aktiviert ist, sollte diese maximale Anzahl gemeinsamer Zugriffe auf '1' gesetzt werden. Die DSE-Komponente kann die Komponente für die parallele Pipelineverarbeitung nicht verwenden.
Der Standardwert ist '1'. Das bedeutet, dass mit jedem Pipelinestartbefehl nur ein einzelner Pipelineverarbeitungsthread gestartet wird. Sie können diesen Standardwert jedoch überschreiben, indem Sie die Anzahl gemeinsamer Zugriffe im Transportparameter des Pipelinestartbefehls angeben.
ErrorLimit
Gibt die Anzahl von Fehlern an, die während der Verarbeitung im System in einem Zeitraum von 24 Stunden auftreten dürfen, bevor die Pipeline beendet wird, bei der die Fehler auftreten. Diese Fehlergrenze schließt Datenbankfehler, Pipelinefehler, Warteschlangenfehler oder UMF-Parsing-Fehler ein. Wenn dieser Einstellungswert '0' ist, werden die Pipelines nie beendet. Dies ist unabhängig von der Anzahl aufgetretener Fehler.
UMF-Ausnahmebedingungsfehler sind in dieser Einstellung der Fehlergrenze nicht enthalten. Fehlergrenzen für UMF-Ausnahmebedingungen werden mit Hilfe der Parameter LogOnAllUMFExceptions und StopOnAllUMFExceptions festgelegt.
Diese Einstellung interagiert mit dem Parameter ErrorRestInterval.
Der Standardwert lautet '0'.
ErrorResetInterval
Gibt an, wie viele Minuten lang das System Fehler zählt, die auf den Parameter ErrorLimit zutreffen, bevor die Fehlerzählung für die Pipeline zurückgesetzt wird.
Wenn die angegebene Anzahl von Minuten abgelaufen ist, ohne dass das System die ErrorLimit-Anzahl überschritten hat, setzt das System die Zahl der für diese Pipeline gezählten Fehler zurück.
Wenn das System die im Parameter ErrorLimit angegebene Anzahl von Fehlern überschreitet, bevor die im Parameter ErrorResetInterval angegebene Anzahl von Minuten abgelaufen ist, beendet das System die betroffene Pipeline.
Der Standardwert ist auf '1440' gesetzt.
LogOnAllUMFExceptions
Gibt an, ob UMF-Ausnahmebedingungen in der Pipelineprotokolldatei *.msg protokolliert werden. Dabei ist * der Name der Pipeline, in der die Ausnahmebedingung aufgetreten ist. Gültige Werte sind 'Y' oder 'N'.
  • Ist der Parameter auf 'Y' gesetzt, werden alle ankommenden Daten, die UMF-Ausnahmebedingungen generieren, in eine Protokolldatei *.msg gestellt, und die Ausnahmebedingungen werden in der Tabelle UMF_EXCEPT protokolliert.
  • Ist dieser Parameter auf 'N' gesetzt, protokolliert das System die UMF-Ausnahmebedingungen nicht in der Protokolldatei *.msg. Die Ausnahmebedingungen werden jedoch weiterhin in der Tabelle UMF_EXCEPT protokolliert.
Diese Einstellung interagiert mit der Einstellung StopOnAllUMFExceptions.
Der Standardwert lautet 'Y'.
StopOnAllUMFExceptions
Gibt an, ob das System die Verarbeitung ankommender Daten stoppt und die Pipeline beendet, wenn eine UMF-Ausnahmebedingung auftritt, oder ob dies nicht geschieht. Gültige Werte sind 'Y' oder 'N'.
  • Ist dieser Parameter auf 'Y' gesetzt, stoppt das System beim Auftreten des ersten UMF-Fehlers automatisch die Verarbeitung aller ankommenden Daten und beendet die Pipeline. Diese Einstellung wird im Allgemeinen nur während der Erstimplementierungen verwendet, um zusätzliche Informationen zu ankommenden UMF-Ausnahmebedingungen zusammenzustellen.
  • Ist dieser Parameter auf 'N' gesetzt, der Parameter LogOnAllUMFExceptions jedoch auf 'Y', protokolliert das System die UMF-Ausnahmebedingung in der UMF-Protokolldatei und setzt die Verarbeitung der ankommenden Daten fort. Die von der UMF-Ausnahmebedingung betroffenen Daten werden nicht verarbeitet. Das bedeutet, dass Sie das UMF-Ausnahmeprotokoll prüfen müssen, um das UMF-Problem zu finden, die Daten zu korrigieren und anschließend den gesamten UMF-Datensatz zur Verarbeitung erneut in eine Pipeline zu laden.
  • Sind dieser Parameter und der Parameter LogOnAllUMFExceptions auf 'N' gesetzt, führt die Pipeline den Datenladevorgang teilweise aus. Geladen werden dabei nur die Daten, die nicht in der UMF-Ausnahmebedingung enthalten sind. Die in der UMF-Ausnahmebedingung enthaltenen Daten werden nicht verarbeitet. Das bedeutet, dass Sie das UMF-Ausnahmeprotokoll prüfen müssen, um das UMF-Problem zu finden, die Daten zu korrigieren und anschließend die korrigierten Daten zur Verarbeitung erneut in eine Pipeline zu laden.
Der Standardwert ist auf 'N' und der Standardwert für den Parameter LogOnAllUMFExceptions ist auf 'Y' gesetzt. Das bedeutet, dass das System die UMF-Ausnahmebedingung standardmäßig in der UMF-Protokolldatei protokolliert und den ankommenden Datensatz mit dem UMF-Fehler nicht verarbeitet.

Parameter für den Abschnitt [SQL]

Definiert die Konfiguration für die Datenbankverbindung zwischen den Pipelines und der Entitätendatenbank.

Connection
Gibt die URI (Universal Resource Indicator) für Pipelines an, die eine Verbindung zur Entitätendatenbank herzustellen sollen. Jeder Datenbanktyp verwendet zwar eine bestimmte von den anderen abweichende Syntax, die Basissyntax aber wird wie folgt angegeben:
typ://benutzer:kennwort@datenbank/?timeout=N
Geben Sie Folgendes ein, um eine DB2-Datenbankverbindung anzugeben:
db2://benutzer:kennwort@datenbank/?timeout=N/?schema=schemaname
Dabei gilt Folgendes:
  • db2:// gibt den Datenbanktyp an.
  • benutzer:kennwort@datenbank gibt die Anmeldungsdaten an (Benutzername und Kennwort), um auf die angegebene Datenbank zuzugreifen.
  • /?timeout=N gibt die Anzahl der Sekunden an, die die Pipeline auf eine Antwort von der Datenbank wartet, bevor ein Zeitlimit überschritten wird.
  • /?schema=schemaname ist der Name eines benutzerdefinierten DB2-Schemas. (Diese Einstellung ist optional und wird in der Regel nur verwendet, wenn Sie ein vom Standard abweichendes oder benutzerdefiniertes DB2-Datenbankschema angeben wollen.)
Anmerkung: Die DB2-Funktion für benutzerdefinierte Schemata ist mit dem Berichtsgenerator in Visualizer und in der Konfigurationskonsole nicht kompatibel. Wenn Sie ein benutzerdefiniertes DB2-Schema angeben, können die Visualizer- und Konfigurationskonsolberichte nicht erstellt werden.
Geben Sie Folgendes ein, um eine Oracle-Datenbankverbindung anzugeben:
oci://benutzer:kennwort@SID
Dabei gibt benutzer kennwort die Anmeldungsdaten an (Benutzername und Kennwort), um auf die Datenbank zuzugreifen.
SID entspricht dem für diese Oracle-Datenbank gesetzten SID-Parameter.
/?timeout=N gibt die Anzahl von Sekunden an, die die Pipeline auf eine Antwort von der Datenbank wartet, bevor ein Zeitlimit überschritten wird.
Geben Sie Folgendes ein, um eine Microsoft SQL-Datenbankverbindung anzugeben:
mssql://benutzer.kennwort@DSN
Dabei gibt benutzer kennwort die Anmeldungsdaten an (Benutzername und Kennwort), um auf die Datenbank zuzugreifen.
DSN entspricht dem für diese Microsoft SQL Server-Datenbank gesetzten DSN-Parameter.
/?timeout=N gibt die Anzahl von Sekunden an, die die Pipeline auf eine Antwort von der Datenbank wartet, bevor ein Zeitlimit überschritten wird.
Standardmäßig wird diese Einstellung nicht angegeben.
LogTable
Gibt die Tabelle an, die verwendet werden soll, wenn das System UMF-Nachrichten protokolliert. Verwenden Sie diesen Parameter, wenn Sie mehrere Pipelines haben, die Daten an dieselbe Entitätendatenbank senden. Jede Pipeline muss Protokolldaten in separate Tabellen schreiben.
Wenn Sie nicht den Standardwert UMF_LOG, sondern eine andere Tabelle angeben, müssen Sie die neue Tabelle in der Datenbank erstellen. Diese Tabelle muss die gleichen Felder enthalten wie die Tabelle UMF_LOG.
DeadLockRetries
Gibt die Anzahl von Wiederholungen an, die das System während der Verarbeitung einer ankommenden UMF-Nachricht auszuführen versucht, nachdem die Pipeline das Zeitlimit oder die Deadlock-Bedingungen überschritten hat. Wenn diese Anzahl überschritten ist, wird die Pipeline beendet.
Der Standardwert lautet '3', ist jedoch in der Regel durch Voranstellen des Nummernzeichens auf Kommentar gesetzt.
DebugLevel
Steuert den Detaillierungsgrad der Nachrichten, die an das SQL-Debugprotokoll *.SqlDebug.log gesendet werden. Dabei ist * der Name des Pipelineknotens im Debugmodus. Gültige Werte sind:
  • Wenn dieser Parameter auf '0' gesetzt ist, wird kein Protokoll erstellt. Verwenden Sie diesen Wert nur für das Debugging.
  • Wenn dieser Parameter auf '1' gesetzt ist, protokolliert das System Leistungsstatistikdaten.
  • Wenn dieser Parameter auf '2' gesetzt ist, protokolliert das System alle SQL-Nachrichten.
  • Wenn dieser Parameter auf '3' gesetzt ist, protokolliert das System alle Leistungsstatistikdaten und alle SQL-Nachrichten.
Der Standardwert lautet '0'. Das bedeutet, dass standardmäßig keine Nachrichten an das SQL-Debugprotokoll gesendet werden.

Parameter für den Abschnitt [OAC]

Definiert die Konfigurationsparameter für die Adresskorrektur, die in der Pipelineverarbeitung integriert ist.
Anmerkung: Jede Komponente der Software wird von unabhängigen Softwareanbietern bereitgestellt und von diesen Anbietern separat lizenziert.
AddrConnection
Gibt die URI für die Adresskorrektursoftware an. Für den Wert muss eine bestimmte Syntax verwendet werden:
produkttyp://host:portnummern
produkttyp
  • Wenn Sie IBM WebSphere QualityStage verwenden, verwenden Sie waves.
  • Wenn Sie Group 1 Software Universal Coder verwenden, setzen Sie diesen Wert auf g1unc.
  • Wenn Sie Group 1 Software CODE-1 Plus verwenden, setzen Sie diesen Wert auf g1cs.
    Anmerkung: Wenn Sie von einem Group 1 Software-Produkt zu IBM WebSphere QualityStage wechseln wollen, wenden Sie sich an Ihren Professional Services-Ansprechpartner, um Unterstützung für den Umstieg zu erhalten, denn es gibt Unterschiede in dem Produkt, die abweichende Adresshashes verursachen.
host
Gibt den Namen des Hostsystems an, das die Adresskorrektursoftware ausführt, oder die IP-Adresse des Host-Servers für die Adresskorrektursoftware.
portnummern
Gibt die Portnummern an, die für die Adresskorrektursoftware verwendet werden sollen. Sie können die Standardportnummer(n) für die von Ihrem System verwendete Adresskorrektursoftware verwenden. Oder Sie können, wenn Ihr System für die Verwendung anderer Portnummern konfiguriert ist, die entsprechenden Nummern hier angeben.
Diese Liste enthält die Standardportnummern nach Adresskorrektursoftware:
  • Für IBM WebSphere QualityStage lautet die Standardportnummer 6010.
  • Für Group 1 Software Universal Coder lautet die Standardportnummer 8080.
  • Für Group 1 Software CODE-1 Plus lauten die Standardportnummern wie folgt:
    • Für United States CODE-1 Plus: Verwenden Sie us_port=3008.
    • Für Canadian CODE-1 Plus: Verwenden Sie can_port=3014.
    • Für International CODE-1 Plus: Verwenden Sie int_port=3006.
Der Standardwert für diese Parameter ist leer.
GeoConnection
Verwenden Sie diesen Parameter nur, wenn Sie Group 1 Software Geographic CODE-1 verwenden. Der Parameter gibt den Hostnamen (oder die IP-Adresse) und die Portnummer für das Group 1 Software Geographic Coding Plus-Produkt an. Diese Einstellung verwendet eine bestimmte Syntax:
produkttyp://host:portnummer
produkttyp
  • Verwenden Sie g1cs.
host
Der Name des Hostsystems, das die Adresskorrektursoftware ausführt, oder die IP-Adresse des Host-Servers für die Adresskorrektursoftware.
portnummer
Geben Sie die Portnummer für diese Verbindung an, oder verwenden Sie den Standardwert 3010.
OverrideState
Verwenden Sie diesen Parameter nur, wenn Sie Group 1 Software verwenden und das System den ankommenden Wert für den US-Bundesstaat durch den zugeordneten zweistelligen Bundesstaatencode ersetzen soll. Gültige Werte sind 'Y' oder 'N'.
  • Ist dieser Parameter auf 'Y' gesetzt, wird der ankommende Wert für den US-Bundesstaat durch den ihm zugeordneten zweistelligen Bundesstaatencode ersetzt.
  • Ist dieser Parameter auf 'N' gesetzt, wird der ankommende Wert für den US-Bundesstaat nicht ersetzt, sondern unverändert beibehalten.
Der Standardwert lautet 'Y'.

Parameter für den Abschnitt [MM]

Definiert Konfigurationsparameter für die Entitätsauflösung.

DOBConfThreshold
Gibt den Schwellenwert für die Bestätigung oder Zurückweisung des Geburtsdatums an. Die Bewertung des Geburtsdatums ist eine Punkteskala von 0 bis 100, die auf dem Algorithmus für die Geburtsdatumsauflösung basiert. Dieser Parameter legt die Punktestufe fest, bei der Abweichungen des Geburtsdatums zur Zurückweisung führen.
Je höher die Zahl für den Schwellenwert ist, umso geringer darf die Abweichung zwischen den Geburtsdaten sein, um eine hohe Bewertung während der Bestätigungs- und Zurückweisungsstufe der Entitätsauflösung zu erreichen.
Der Standardwert lautet '90'.
CircaDOBAttribute
Gibt den Wert ATTR_TYPE_ID in der Tabelle ATTR_TYPE an, der ein ungefähres Geburtsdatum angibt.
Der Standardwert lautet '4'. Da ungefähre Geburtsdaten selten verwendet werden, wird diese Standardeinstellung in der Regel durch Voranstellen des Nummernzeichens auf Kommentar gesetzt.
CircaRangeThreshold
Gibt die Anzahl von Einheiten an, um die ein Geburtsdatum von einem ungefähren Geburtsdatum abweichen darf, um vom System weiterhin als übereinstimmender Wert angesehen zu werden. Dieser Schwellenwert wird mit dem Parameter CircaRangeType verwendet.
Der Standardwert lautet '1'. Der Standardwert des Parameters CircaRangeType lautet 'Y'. Zusammen geben diese Parameter an, dass die Standardzahl von Einheiten, um die ein Geburtsdatum von einem ungefähren Geburtsdatum abweichen darf, 1 Jahr ist.
Da ungefähre Geburtsdaten selten verwendet werden, wird diese Standardeinstellung in der Regel durch Voranstellen des Nummernzeichens auf Kommentar gesetzt.
CircaRangeType
Gibt den Typ der Schwellenwerteinheit für das ungefähre Geburtsdatum an. Dieser Parameter wird mit dem Schwellenwert CircaRangeThreshold verwendet.
Gültige Werte sind 'M' oder 'Y':
  • Wenn dieser Parameter auf 'M' gesetzt ist, wird der Schwellenwert für das ungefähre Geburtsdatum in Monaten angegeben.
  • Wenn dieser Parameter auf 'Y' gesetzt ist, wird der Schwellenwert für das ungefähre Geburtsdatum in Jahren angegeben.
Der Standardwert lautet 'Y'. Das bedeutet, dass das System als Schwellenwert für das ungefähre Geburtsdatum Jahre verwendet. Der Standardwert für CircaRangeThreshold lautet '1'. Zusammen geben diese Parameter an, dass die Standardzahl von Einheiten, um die ein Geburtsdatum von einem ungefähren Geburtsdatum abweichen darf, 1 Jahr ist.
Da ungefähre Geburtsdaten selten verwendet werden, wird diese Standardeinstellung in der Regel durch Voranstellen des Nummernzeichens auf Kommentar gesetzt.
DateRangeThreshold
Gibt die Anzahl Einheiten für die Datumsschwellenwerte 'Von' und 'Bis' an. Dieser Parameter wird mit dem Parameter DateRangeType verwendet.
  • Wenn dieser Parameter auf '-1' gesetzt ist, wird die gesamte Datumsverarbeitung für 'Von' und 'Bis' ignoriert.
  • Wenn dieser Parameter auf '0' gesetzt ist, werden die Datumsangaben 'Von' und 'Bis' wie angegeben verwendet.
  • Wenn dieser Parameter auf eine Zahl zwischen 1 und x gesetzt ist, gibt diese Zahl den maximalen Abstand zwischen sich nicht überschneidenden Datumsbereichen an.
Der Standardwert lautet '0'. Das bedeutet, dass das System die Datumsangaben 'Von' und 'Bis' standardmäßig wie in den ankommenden UMF-Nachrichten angegeben verarbeitet. Diese Einstellung ist in der Regel durch Voranstellen des Nummernzeichens auf Kommentar gesetzt.
DateRangeType
Gibt die Einheit für den Datumsbereichsschwellenwert an. Dieser Parameter wird mit dem Parameter DateRangeThreshold verwendet.
Gültige Werte sind 'D', 'M' oder 'Y':
  • Wenn dieser Parameter auf 'D' gesetzt ist, wird der Schwellenwert für den Datumsbereich in Tagen angegeben.
  • Wenn dieser Parameter auf 'M' gesetzt ist, wird der Schwellenwert für den Datumsbereich in Monaten angegeben.
  • Wenn dieser Parameter auf 'Y' gesetzt ist, wird der Schwellenwert für den Datumsbereich in Jahren angegeben.
Der Standardeintrag lautet 'M'. Das bedeutet, dass das System ankommende Datumsbereiche 'Von' und 'Bis' standardmäßig in Monaten verarbeitet. Diese Einstellung ist in der Regel durch Voranstellen des Nummernzeichens auf Kommentar gesetzt.
LogDenials
Gibt an, ob Zurückweisungsinformationen von der Entitätsauflösung protokolliert werden sollen. Diese Einstellung ist auf Kommentar gesetzt oder muss manuell eingegeben werden.
Gültige Werte sind 'Y' oder 'N'.
  • Wenn dieser Parameter auf 'Y' gesetzt ist, protokolliert das System Zurückweisungen.
  • Wenn dieser Parameter auf 'N' gesetzt ist, protokolliert das System Zurückweisungen nicht. Ist diese Einstellung in der Konfigurationsdatei vorhanden, lautet der Standardwert 'N'.

Parameter für den Abschnitt [DSE]

Definiert Konfigurationsparameter für die DSE-Funktionalität (Dynamic Scoring Engine). Diese Funktionalität wird möglicherweise nicht von allen Pipelines verwendet.
Enabled
Gibt an, ob die DSE-Funktionalität aktiviert ist oder nicht. Gültige Werte sind 'Y' oder 'N'.
  • Wenn dieser Parameter auf 'Y' gesetzt ist, ist die DSE-Funktionalität in der Pipeline aktiviert.
  • Wenn dieser Parameter auf 'N' gesetzt ist, ist die DSE-Funktionalität in der Pipeline inaktiviert.
Der Standardwert lautet 'N'.

Konfigurationsparameter von IBM Degrees of Separation

Wenn Sie IBM Degrees of Separation für Relationship Resolution installieren, können Sie zusätzliche Parameter für diese Komponente konfigurieren, nachdem Sie die IBM Degrees of Separation-Komponente und die zugehörigen Informationen installiert haben. Wenn Sie die Komponente und die zugehörigen Informationen bereits installiert haben, können Sie die Konfigurationsparameter über den Link in der Navigationsstruktur der Informationszentrale anzeigen.

Konfigurationsparameter von IBM Entity Analytic Solutions Name Manager

Wenn Sie IBM Entity Analytic Solutions Name Manager installieren, können Sie zusätzliche Parameter für diese Komponente konfigurieren, nachdem Sie die IBM Entity Analytic Solutions Name Manager-Komponente und die zugehörigen Informationen installiert haben. Wenn Sie die Komponente und die zugehörigen Informationen bereits installiert haben, können Sie die Konfigurationsparameter über den Link in der Navigationsstruktur der Informationszentrale anzeigen.

Zugehörige Verweise
Prüfliste zur Fehlerbehebung für Pipelines


Feedback

Letzte Aktualisierung: 2007