IM Centre de documentation de Relationship Resolution, Version 4.2

Paramètres du fichier de configuration des pipelines

Le fichier de configuration de pipeline (généralement pipeline.ini) contient les valeurs initiales des variables et les informations de configuration dont les pipelines ont besoin pour traiter les données entrantes. Les paramètres du fichier de configuration de pipeline supplantent les paramètres système globaux (notamment dans les paramètres système) de tous les pipelines qui utilisent le même fichier de configuration.

Vous pouvez ajouter ou modifier manuellement des paramètres ou des valeurs dans le fichier de configuration des pipelines. Toutefois, ce faisant, vous risquez d'endommager ce fichier, de créer une configuration non valide ou de provoquer une interruption du traitement des pipelines. Avant d'apporter des modifications au fichier de configuration des pipelines, créez une copie de sauvegarde de ce même fichier.

Paramètres de la section [pipeline]

Contient des données de configuration pour les pipelines. Ne pas modifier le nom de cet en-tête de section, qui doit rester [pipeline] ; sinon, les pipelines qui utilisent ce fichier de configuration s'arrêteront pour cause d'erreur.

CMEAdminTransport
Désigne l'URI (Uniform Resource Identifier) HTTP du transport vers la console de configuration, qui est le composant contenant le moniteur d'applications. Le moniteur d'applications permet de contrôler l'état et les statistiques des pipelines et d'acheminer les résultats en provenance des ces derniers.
La valeur par défaut est vide. Ce paramètre est généralement encadré par des délimiteurs de commentaire.
InputTransport
Spécifie l'identificateur URI du transport dans lequel le pipeline reçoit les données entrantes. Si le transport spécifié n'existe pas, le système ne démarre pas le pipeline, ou procède à son arrêt.
Vous pouvez indiquer plusieurs transports en séparant les URI par un espace.
La valeur par défaut est vide. Ce paramètre est généralement mis en commentaire, car les transports entrants sont habituellement spécifiés via la ligne de commande au démarrage des pipelines.
Accès concurrent
Indique le nombre d'unités d'exécution pour le traitement simultané de pipelines parallèles lorsqu'un seul processus de pipeline est démarré. Ce paramètre peut être un entier positif supérieur ou égal à 0. Plus cette valeur est élevée, plus grand est le nombre d'unités d'exécution démarrées avec chaque commande de démarrage de pipeline, et plus grand est le nombre d'enregistrements entrants pouvant être traités simultanément. (Un enregistrement est traité par chaque unité d'exécution de traitement parallèle.)
Ce paramètre est prioritaire sur le paramètre système DEFAULT_CONCURRENCY spécifié sous l'onglet Paramètres système de la console de configuration.
Si le moteur d'évaluation dynamique est activé dans la section [DSE], il convient de définir le nombre maximal d'accès concurrents sur la valeur 1. Le moteur d'évaluation dynamique ne fonctionne pas en adéquation avec la fonction de traitement parallèle des pipelines.
La valeur par défaut est 1, ce qui signifie qu'une seule unité d'exécution de traitement de pipeline est générée pour chaque commande de démarrage de pipeline. Vous pouvez toutefois remplacer cette valeur par défaut en spécifiant le nombre d'accès concurrents dans les paramètres de transport de la commande de démarrage de pipelines.
ErrorLimit
Définit le nombre d'erreurs pouvant survenir sur le système pendant une durée de traitement de 24 heures avant l'arrêt du pipeline sur lequel les erreurs sont survenues. Ce seuil d'erreur inclut les erreurs de base de données, du pipeline, des files d'attente ou de l'analyse syntaxique UMF. Si ce paramètre vaut 0, l'arrêt des pipelines n'a jamais lieu, quel que soit le nombre d'erreurs détectées.
Les erreurs d'exception UMF ne sont pas incluses dans cette valeur limite d'erreurs. Les limites d'erreurs liées aux exceptions UMF sont définies via les paramètres LogOnAllUMFExceptions et StopOnAllUMFExceptions.
Ce paramètre interagit avec le paramètre ErrorRestInterval.
La valeur par défaut est définie sur 10.
ErrorResetInterval
Définit la durée en minutes de comptabilisation par le système des erreurs liées au paramètre ErrorLimit avant de réinitialiser le nombre d'erreurs du pipeline.
Si le nombre de minutes spécifié s'écoule avant le dépassement du décompte spécifié par le paramètre ErrorLimit, le système réinitialise le comptage d'erreurs sur le pipeline concerné.
Si le système dépasse le nombre d'erreurs spécifié par le paramètre ErrorLimit avant que le nombre de minutes défini par le paramètre ErrorResetInteral ne soit atteint, le système arrête le pipeline concerné.
La valeur par défaut est définie sur 1440.
LogOnAllUMFExceptions
Indique si les exceptions UMF sont consignées dans le fichier journal du pipeline, *.msg sachant que * désigne le nom du pipeline où l'exception est survenue. Les valeurs admises sont Y ou N :
  • Si le paramètre est défini sur la valeur Y, toutes les données entrantes qui génèrent des exceptions UMF sont placées dans un fichier journal *.msg et l'exception est consignée dans la table UMF_EXCEPT.
  • Si ce paramètre est défini sur la valeur N, le système ne consigne aucune exception UMF dans un fichier journal *.msg. Toutefois, les exceptions restent consignées dans la table UMF_EXCEPT.
Ce paramètre interagit avec le paramètre StopOnAllUMFExceptions.
La valeur par défaut est définie sur Y.
StopOnAllUMFExceptions
Indique si le système doit arrêter ou non le traitement des données entrantes, ainsi que le pipeline, en cas d'exception UMF. Les valeurs admises sont Y ou N :
  • Si ce paramètre est défini sur Y, le système cesse automatiquement de traiter toutes les données entrantes dès que la première erreur UMF a été détectée, puis arrête le pipeline. Ce paramètre n'est généralement utilisé que durant les mises en oeuvre initiales, dans le but de recueillir des informations complémentaires sur les exceptions UMF entrantes.
  • Si ce paramètre est défini sur la valeur N, mais que le paramètre LogOnAllUMFExceptions est défini sur Y, le système consigne l'exception UMF dans le fichier journal UMF et poursuit le traitement des données entrantes. Les données impliquées dans l'exception UMF ne sont pas traitées, ce qui signifie que vous devez consulter le journal des exceptions UMF pour localiser l'incident lié à UMF, corriger les données, puis recharger complètement l'enregistrement UMF dans un pipeline en vue de permettre son traitement.
  • Si ce paramètre est défini sur la valeur N et que le paramètre LogOnAllUMFExceptions est également défini sur N, le pipeline effectue un chargement partiel des données, en incluant uniquement celles qui ne font pas partie de l'exception UMF. Les données incluses dans l'exception UMF ne sont pas traitées, ce qui signifie que vous devez consulter le journal des exceptions UMF pour localiser l'incident lié à UMF, corriger les données, puis recharger les données rectifiées dans un pipeline en vue de permettre son traitement.
La valeur par défaut est N, tandis que celle du paramètre LogOnAllUMFExceptions est Y. Ceci signifie que par défaut, le système consigne l'exception UMF dans le fichier journal UMF et ne poursuit pas le traitement des enregistrements de données entrants.

Paramètres de la section [SQL]

Définit la configuration de la connexion de base de données entre les pipelines et la base de données d'entité.

Connexion
Spécifie l'identificateur URI (Universal Resource Indicator) permettant de connecter les pipelines à la base de données d'entité. Chaque type de base de données fait appel à une syntaxe spécifique, mais la syntaxe de base se définit comme suit :
type://utilisateur:mot_de_passe@database/?timeout=N
Pour spécifier une connexion à une base de données DB2
db2://utilisateur:mot_de_passe@bdd/?délai_attente=N/?schéma=nom_schéma
sachant que
  • db2:// indique la type de base de données
  • utilisateur:mot_de_passe@database spécifie le nom de connexion (nom d'utilisateur et mot de passe) permettant d'accéder à la base de données spécifiée
  • /?timeout=N indique le délai (en secondes) pendant lequel le pipeline attend une réponse de la base de données avant expiration.
  • et /?schema=nom_schéma est le nom d'un schéma DB2 personnalisé. (Ce paramètre est facultatif et ne sert généralement que lorsque l'on souhaite indiquer un schéma de base de données DB2 non standard ou personnalisé.)
Remarque : La fonction de schéma personnalisé DB2 n'est pas compatible avec le générateur de rapports dans Visualizer et la console de configuration. Si vous spécifiez un schéma DB2 personnalisé, les rapports de Visualizer et de la console de configuration ne fonctionneront pas.
Pour spécifier une connexion à la base de données Oracle
oci://utilisateur:mot_de_passe@SID
sachant que utilisateur mot_de_passe spécifie le nom de connexion (nom d'utilisateur et mot de passe) permettant d'accéder à la base de données
SID correspond à l'ensemble de paramètres SID de cette base de données Oracle.
et /?timeout=N indique le délai (en secondes) pendant lequel le pipeline attend une réponse de la base de données avant expiration.
Pour désigner une connexion à la base de données Microsoft SQL Server
mssql://utilisateur.mot_de_passe@DSN
sachant que utilisateur mot_de_passe spécifie le nom de connexion (nom d'utilisateur et mot de passe) permettant d'accéder à la base de données
et DSN correspond à l'ensemble de paramètres DSN de cette base de données Microsoft SQL Server.
et /?timeout=N indique le délai (en secondes) pendant lequel le pipeline attend une réponse de la base de données avant expiration.
La valeur par défaut est vide.
LogTable
Désigne la table à utiliser quand le système consigne les messages UMF. Utilisez ce paramètre lorsque vous disposez de plusieurs pipelines envoyant des données vers la même base de données d'entité. Chaque pipeline requiert l'inscription des données de journalisation dans des tables distinctes.
Si vous indiquez une table autre que la valeur par défaut UMF_LOG, vous devez créer la nouvelle table dans la base de données en spécifiant les mêmes zones que dans la table UMF_LOG.
DeadLockRetries
Spécifie le nombre de nouvelles tentatives par le système durant le traitement d'un message UMF entrant après l'expiration du délai d'attente du pipeline ou le dépassement du seuil d'interblocage. Si ce nombre est dépassé, le pipeline s'arrête.
La valeur par défaut est 3, mais elle est généralement mise en commentaire au moyen du signe dièse.
DebugLevel
Contrôle le niveau de détail des messages envoyés dans le journal de débogage SQL, *.SqlDebug.log, où * est le nom de noeud du pipeline défini en mode débogage. Les valeurs admises sont les suivantes :
  • Si ce paramètre est défini sur 0, aucun journal n'est créé. A n'utiliser que pour le débogage.
  • Si ce paramètre est défini sur 1, le système consigne les statistiques de performance.
  • Si ce paramètre est défini sur 2, le système consigne tous les messages SQL.
  • Si ce paramètre est défini sur la valeur 3, le système consigne les statistiques de performances, ainsi que tous les messages SQL.
La valeur par défaut, 0, signifie que par défaut, aucun message n'est envoyé dans le journal de débogage SQL.

Paramètres de la section [OAC]

Définit les paramètres de configuration de la correction d'adresse intégrée au traitement du pipeline.
Remarque : Chaque fonctionnalité du logiciel est fournie par des éditeurs de logiciels indépendants et font l'objet d'un octroi de licence distinct par ces éditeurs.
AddrConnection
Indique l'URI du logiciel de correction d'adresse. La valeur doit être conforme à la syntaxe spécifique suivante :
prodtype://hôte:numéros_de_port
prodtype
  • Si vous utilisez IBM WebSphere QualityStage, utilisez waves .
  • Si vous utilisez le logiciel Universal Coder de Group 1 Software, indiquez la valeur g1unc.
  • Si vous utilisez le logiciel CODE-1 Plus de Group 1 Software, spécifiez la valeur g1cs.
    Remarque : Si vous optez pour une transition entre un produit Group 1 Software vers IBM WebSphere QualityStage, contactez votre représentant Professional Services ou le service de support logiciel IBM pour réaliser la transition, étant donné que les différences entre les produits génèrent des adresses hachées distinctes.
hôte
Définit le nom de la machine hôte qui exécute le logiciel de correction d'adresse ou l'adresse IP du serveur hôte hébergeant le logiciel de correction d'adresse.
numéros_de_port
Indique les numéros de port à utiliser pour le logiciel de correction d'adresse. Vous pouvez définir le(s) numéro(s) de port par défaut pour le logiciel de correction d'adresse utilisé par votre système ou, si votre système est configuré en vue d'utiliser d'autres numéros de port, vous spécifiez ces derniers ici.
Dans cette liste figurent les numéros de port par défaut par logiciel de correction d'adresse :
  • Pour IBM WebSphere QualityStage, le numéro de port par défaut est 6010.
  • Pour Group1 Software Universal Coder, le numéro de port par défaut est 8080.
  • Pour CODE-1 Plus de Group1 Software, les numéros de port par défaut sont :
    • Pour CODE-1 Plus aux Etats-Unis, utilisez us_port=3008.
    • Pour CODE-1 Plus au Canada, utilisez can_port=3014.
    • Pour CODE-1 Plus international, utilisez int_port=3006.
La valeur par défaut de ces paramètres est vide.
GeoConnection
N'utilisez ce paramètre que si vous vous servez de Group 1 Software Geographic CODE-1 Plus. Le paramètre définit le nom de l'hôte (ou l'adresse IP) et le numéro de port pour le produit Group1 Software Geographic Coding Plus. Ce paramètre fait appel à une syntaxe spécifique :
prodtype://hôte:numéro_de_port
prodtype
  • Utilisez g1cs
hôte
Nom de la machine hôte qui exécute le logiciel de correction d'adresse ou l'adresse IP du serveur hôte hébergeant le logiciel de correction d'adresse.
numéro_de_port
Indiquez le numéro de port de cette connexion, ou appliquez la valeur par défaut 3010.
OverrideState
N'utilisez ce paramètre qu'avec les produits Group1 Software et si vous souhaitez que le système remplace la valeur d'un Etat américain par le code d'état à deux chiffres associé. Les valeurs admises sont Y ou N :
  • Si ce paramètre est défini sur Y, la valeur entrante désignant un Etat américain est remplacée par le code d'état à deux chiffres correspondant.
  • Si ce paramètre est défini sur N, la valeur entrante désignant un Etat américain n'est pas remplacée et demeure inchangée.
La valeur par défaut est définie sur Y.

Paramètres de la section [MM]

Définit les paramètres de configuration pour une résolution d'entité.

DOBConfThreshold
Définit le seuil de concordance ou discordance de la date de naissance. L'évaluation de la date de naissance s'appuie sur une échelle de points numérotée de 0 à 100 et des algorithmes de résolution de dates de naissance. Ce paramètre définit le niveau de point à partir duquel les différences entre les dates de naissance deviennent des discordances.
Plus la valeur de seuil est élevée, plus faible est le score des différences entre les dates de naissance au stade de confirmation ou de discordance de la résolution d'entité.
La valeur par défaut est définie sur 90.
CircaDOBAttribute
Spécifie la valeur ATTR_TYPE_ID dans la table ATTR_TYPE pour indiquer une date de naissance approximative.
La valeur par défaut est 4. Toutefois, du fait que les dates de naissance approximatives sont rarement utilisées, ce paramètre par défaut est généralement mis en commentaire au moyen du signe dièse.
CircaRangeThreshold
Spécifie le nombre d'unités de différence admissibles entre une date de naissance (DOB) et une date de naissance approximative dans les limites de laquelle le système considère toujours la valeur comme une correspondance. Ce seuil est utilisé en association avec le paramètre CircaRangeType.
La valeur par défaut est 1. La valeur par défaut du paramètre CircaRangeType est Y. Ensemble, ces paramètres indiquent que le nombre par défaut d'unités de différence entre une date de naissance et date de naissance approximative correspond à une année.
Toutefois, du fait que les dates de naissance approximatives sont rarement utilisées, ce paramètre par défaut est généralement mis en commentaire au moyen du signe dièse.
CircaRangeType
Indique le type d'unité de seuil de la date de naissance approximative. Ce paramètre s'utilise avec le seuil CircaRangeThreshold.
Les valeurs admises sont M ou Y :
  • Si ce paramètre est défini sur M, le seuil de date de naissance approximative est exprimé en mois.
  • Si ce paramètre est défini sur Y, le seuil de date de naissance approximative est exprimé en années.
La valeur par défaut, Y, signifie que le système utilise les années en tant que seuil de date de naissance approximative. La valeur par défaut de CircaRangeThreshold est 1. Ensemble, ces paramètres indiquent que le nombre par défaut d'unités de différence entre une date de naissance et date de naissance approximative correspond à une année.
Toutefois, du fait que les dates de naissance approximatives sont rarement utilisées, ce paramètre par défaut est généralement mis en commentaire au moyen du signe dièse.
DateRangeThreshold
Indique le nombre d'unités des seuils de date de début et de fin. Ce paramètre s'utilise avec le paramètre DateRangeType.
  • Si ce paramètre est défini sur -1, ignorer tout traitement de date de début et de fin.
  • Si ce paramètre est défini sur -1, utiliser les dates de début et de fin telles qu'indiquées.
  • Si ce paramètre est défini sur un nombre compris entre 1 et x, ce nombre représente l'écart maximal pour les plages de dates non concomitantes.
La valeur par défaut est 0. Ainsi, par défaut, le système traite les dates Depuis et Jusqu'à conformément aux spécifications du message UMF entrant. Ce paramètre est généralement mis en commentaire au moyen du signe dièse.
DateRangeType
Indique l'unité du seuil de plage de dates. Ce paramètre s'utilise avec DateRangeThreshold.
Les valeurs admises sont D, M ou Y :
  • Si ce paramètre est défini sur D, le seuil de plage de dates est exprimé en jours.
  • Si ce paramètre est défini sur M, le seuil de plage de dates est exprimé en mois.
  • Si ce paramètre est défini sur Y, le seuil de plage de dates est exprimé en années.
La valeur d'entrée par défaut est M. Ainsi, par défaut, le système traite les plages de date entrantes A partir de et Jusqu'à spécifiées en nombre de mois. Ce paramètre est généralement mis en commentaire au moyen du signe dièse.
LogDenials
Indique s'il faut consigner les informations de discordance provenant de la résolution d'entité. Ce paramètre est mis en commentaire ou doit être saisi manuellement.
Les valeurs admises sont Y ou N :
  • Si ce paramètre est défini sur Y, le système consigne les discordances.
  • Si ce paramètre est défini sur N, le système ne consigne pas les discordances. Si ce paramètre est présent dans le fichier de configuration, la valeur par défaut est N.

Paramètres de la section [DSE]

Définit les paramètres de configuration pour la fonction du moteur d'évaluation dynamique. Cette fonctionnalité n'est pas forcément utilisée sur tous les pipelines.
Activée
Indique si le moteur d'évaluation dynamique est activé ou non. Les valeurs admises sont Y ou N :
  • Si ce paramètre est défini sur la valeur Y, le moteur d'évaluation dynamique est activé sur le pipeline.
  • Si ce paramètre est défini sur la valeur N, le moteur d'évaluation dynamique est désactivé sur le pipeline.
La valeur par défaut est définie sur N.

Paramètres de configuration d'IBM Degrees of Separation

Lorsque vous installez IBM Degrees of Separation pour Relationship Resolution, vous pouvez configurer des paramètres complémentaires pour ce composant après son installation, ainsi que pour les informations associées. Si vous avez déjà installé le composant et ses informations, utilisez le lien situé dans l'arborescence de navigation du centre de documentation pour consulter ses paramètres de configuration.

Paramètres de configuration d'IBM Entity Analytic Solutions Name Manager

Lorsque vous installez IBM Entity Analytic Solutions Name Manager, vous pouvez configurer des paramètres complémentaires pour ce composant après son installation, ainsi que pour les informations associées. Si vous avez déjà installé le composant et ses informations, utilisez le lien situé dans l'arborescence de navigation du centre de documentation pour consulter ses paramètres de configuration.

Référence associée
Liste de vérifications du dépannage des pipelines


Appréciations en retour

Dernière mise à jour : 2007