IM Centre de documentation d'Entity Analytic Solutions Name Manager, Version 4.2

Paramètres du fichier de configuration du pipeline

Le fichier de configuration du pipeline (généralement intitulé pipeline.ini) contient les valeurs initiales de variables et les informations de configuration nécessaires aux pipelines pour traiter les données entrantes. Les paramètres contenus dans le fichier de configuration du pipeline remplacent les paramètres généraux du système pour les pipelines utilisant le même fichier de configuration du pipeline.

Vous pouvez ajouter ou modifier manuellement des paramètres ou des valeurs dans le fichier de configuration des pipelines. Toutefois, en ce faisant, vous risquez d'endommager ce fichier, de créer une configuration non valide ou de provoquer une interruption du traitement des pipelines. Avant d'apporter toute modification au fichier de configuration des pipelines, créez une copie de sauvegarde de ce même fichier.

Paramètres de la section [pipeline]

Contient les données de configuration des pipelines. Ne renommez pas cet en-tête de section : si l'intitulé [pipeline] est modifié, une erreur se produira lors de l'arrêt des pipelines utilisant ce fichier de configuration.

CMEAdminTransport
Spécifie l'identificateur URI (Uniform Resource Identifier) HTTP du transport vers la console de configuration, qui est le composant contenant le moniteur d'applications. Le moniteur d'applications permet de contrôler l'état et les statistiques des pipelines et d'acheminer les résultats en provenance des ces derniers.
Par défaut, cette valeur n'est pas renseignée. Ce paramètre est généralement mis en commentaire.
InputTransport
Spécifie l'identificateur URI du transport dans lequel le pipeline reçoit les données entrantes. Si le transport spécifié n'existe pas, le système ne démarre pas le pipeline, ou procède à son arrêt.
Vous pouvez spécifier plusieurs transports en insérant un espace entre les identificateurs URI.
Par défaut, cette valeur n'est pas renseignée. Ce paramètre est généralement mis en commentaire, car les transports entrants sont habituellement spécifiés via la ligne de commande au démarrage des pipelines.
Accès concurrent
Indique le nombre d'unités d'exécution pour le traitement simultané de pipelines parallèles lorsqu'un seul processus de pipeline est démarré. Ce paramètre peut être un entier positif supérieur ou égal à 0. Plus cette valeur est élevée, plus grand est le nombre d'unités d'exécution démarrées avec chaque commande de démarrage de pipeline, et plus grand est le nombre d'enregistrements entrants pouvant être traités simultanément (un enregistrement est traité par chaque unité d'exécution de traitement parallèle).
Ce paramètre est prioritaire sur le paramètre système DEFAULT_CONCURRENCY spécifié sous l'onglet Paramètres système de la console de configuration.
Si le moteur d'évaluation dynamique est activé dans la section [DSE], il convient de définir le nombre maximal d'accès concurrents sur la valeur 1. Le moteur d'évaluation dynamique ne fonctionne pas en adéquation avec la fonction de traitement parallèle des pipelines.
La valeur par défaut est 1, ce qui signifie qu'une seule unité d'exécution de traitement de pipeline est générée pour chaque commande de démarrage de pipeline. Vous pouvez toutefois remplacer cette valeur par défaut en spécifiant le nombre d'accès concurrents dans les paramètres de transport de la commande de démarrage de pipelines.
ErrorLimit
Définit le nombre d'erreurs pouvant survenir sur le système pendant une durée de traitement de 24 heures avant l'arrêt du pipeline sur lequel les erreurs sont survenues. Ce seuil d'erreur inclut les erreurs de base de données, du pipeline, des files d'attente ou de l'analyse syntaxique UMF. Si ce paramètre vaut 0, l'arrêt des pipelines n'a jamais lieu, quel que soit le nombre d'erreurs détectées.
Les erreurs liées aux exceptions UMF ne sont pas prises en compte par ce seuil d'erreur. Les limites d'erreurs liées aux exceptions UMF sont définies via les paramètres LogOnAllUMFExceptions et StopOnAllUMFExceptions
Ce paramètre interagit avec le paramètre ErrorRestInterval.
La valeur par défaut est 10.
ErrorResetInterval
Définit la durée en minutes de comptabilisation par le système des erreurs liées au paramètre ErrorLimit avant de réinitialiser le nombre d'erreurs du pipeline.
Si le nombre de minutes spécifié s'écoule avant le dépassement du décompte spécifié par le paramètre ErrorLimit, le système réinitialise le comptage d'erreurs sur le pipeline concerné.
Si le système dépasse le nombre d'erreurs spécifié par le paramètre ErrorLimit avant que le nombre de minutes défini par le paramètre ErrorResetInteral ne soit atteint, le système arrête le pipeline concerné.
La valeur par défaut est 1440.
LogOnAllUMFExceptions
Indique si les exceptions UMF doivent être consignées dans le fichier journal du pipeline, *.msg où * est le nom du pipeline dans lequel l'exception s'est produite. Les valeurs admises sont Y et N :
  • Si le paramètre est défini sur la valeur Y, toutes les données entrantes qui génèrent des exceptions UMF sont placées dans un fichier journal *.msg et l'exception est consignée dans la table UMF_EXCEPT.
  • Si ce paramètre est défini sur la valeur N, le système ne consigne aucune exception UMF dans un fichier journal *.msg. Toutefois, les exceptions restent consignées dans la table UMF_EXCEPT.
Ce paramètre interagit avec le paramètre StopOnAllUMFExceptions.
La valeur par défaut est Y.
StopOnAllUMFExceptions
Indique si le système doit arrêter ou non le traitement des données entrantes, ainsi que le pipeline, en cas d'exception UMF. Les valeurs admises sont Y et N :
  • Si ce paramètre est défini sur Y, le système cesse automatiquement de traiter toutes les données entrantes dès que la première erreur UMF a été détectée, puis arrête le pipeline. Ce paramètre n'est généralement utilisé que durant les mises en oeuvre initiales, dans le but de recueillir des informations complémentaires sur les exceptions UMF entrantes.
  • Si ce paramètre est défini sur la valeur N, mais que le paramètre LogOnAllUMFExceptions est défini sur Y, le système consigne l'exception UMF dans le fichier journal UMF et poursuit le traitement des données entrantes. Les données impliquées dans l'exception UMF ne sont pas traitées, ce qui signifie que vous devez consulter le journal des exceptions UMF pour localiser l'incident lié à UMF, corriger les données, puis recharger complètement l'enregistrement UMF dans un pipeline en vue de permettre son traitement.
  • Si ce paramètre est défini sur la valeur N et que le paramètre LogOnAllUMFExceptions est également défini sur N, le pipeline effectue un chargement partiel des données, en incluant uniquement celles qui ne font pas partie de l'exception UMF. Les données incluses dans l'exception UMF ne sont pas traitées, ce qui signifie que vous devez consulter le journal des exceptions UMF pour localiser l'incident lié à UMF, corriger les données, puis recharger les données rectifiées dans un pipeline en vue de permettre son traitement.
La valeur par défaut est N, tandis que celle du paramètre LogOnAllUMFExceptions est Y. Ceci signifie que par défaut, le système consigne l'exception UMF dans le fichier journal UMF et ne poursuit pas le traitement des enregistrements de données entrants.

Paramètres de la section [SQL]

Définit la configuration de la connexion de base de données entre les pipelines et la base de données d'entité.

Connexion
Spécifie l'identificateur URI (universal resource indicator) permettant de connecter les pipelines à la base de données d'entité. Chaque type de base de données fait appel à une syntaxe spécifique, mais la syntaxe de base se définit comme suit :
type://utilisateur:mot_de_passe@database/?timeout=N
Pour spécifier une connexion à une base de données DB2
db2://user:password@database/?timeout=N/?schema=nomschéma
  • db2:// indique le type de base de données
  • utilisateur:mot_de_passe@database spécifie le nom de connexion (nom d'utilisateur et mot de passe) permettant d'accéder à la base de données spécifiée
  • /?timeout=N indique le délai en secondes) pendant lequel le pipeline attend une réponse de la base de données avant expiration.
  • et /?schema=nomschéma est le nom du schéma DB2 personnalisé. (Ce paramètre est facultatif et utilisé uniquement lorsque vous voulez spécifier un schéma de base de données DB2 non standard ou personnalisé.)
Remarque : La fonction de schéma DB2 personnalisé n'est pas compatible avec le générateur de rapports du visualiseur et de la console de configuration. Si vous spécifiez un schéma DB2 personnalisé, les rappports du visualiseur et de la console de configuration ne fonctionneront pas.
Pour spécifier une connexion à une base de données Oracle
oci://utilisateur:mot de passe@SID
utilisateur mot_de_passe spécifie le nom de connexion (nom d'utilisateur et mot de passe) permettant d'accéder à la base de données
SID correspond au paramètre SID défini pour cette base de données Oracle.
et /?timeout=N indique le délai en secondes) pendant lequel le pipeline attend une réponse de la base de données avant expiration.
Pour spécifier une connexion à une base de données Microsoft SQL Server
mssql://utilisateur.mot_de_passe@DSN
utilisateur mot_de_passe spécifie le nom de connexion (nom d'utilisateur et mot de passe) permettant d'accéder à la base de données
et DSN correspond au paramètre DSN défini pour cette base de données Microsoft SQL Server.
et /?timeout=N indique le délai en secondes) pendant lequel le pipeline attend une réponse de la base de données avant expiration.
Par défaut, cette valeur n'est pas renseignée.
LogTable
Spécifie la table à utiliser pour la consignation des messages UMF par le système. Utilisez ce paramètre lorsque vous disposez de plusieurs pipelines envoyant des données vers la même base de données d'entité. Chaque pipeline requiert l'inscription des données de journalisation dans des tables distinctes.
Si vous indiquez une table autre que la valeur par défaut UMF_LOG, vous devez créer la nouvelle table dans la base de données en spécifiant les mêmes zones que dans la table UMF_LOG.
DeadLockRetries
Spécifie le nombre de nouvelles tentatives par le système durant le traitement d'un message UMF entrant après l'expiration du délai d'attente du pipeline ou le dépassement du seuil d'interblocage. En cas de dépassement de cette valeur, le pipeline s'arrête.
La valeur par défaut est 3, mais elle est généralement mise en commentaire au moyen du signe dièse.
DebugLevel
Contrôle le niveau de détail des messages envoyés dans le journal de débogage SQL *.SqlDebug.log, où * est le nom de noeud du pipeline défini en mode débogage. Les valeurs admises sont les suivantes :
  • Si ce paramètre est défini sur 0, aucun journal n'est créé. Option utilisée uniquement aux fins de débogage.
  • Si ce paramètre est défini sur la valeur 1, le système consigne les statistiques de performances.
  • Si ce paramètre est défini sur la valeur 2, le système consigne tous les messages SQL.
  • Si ce paramètre est défini sur la valeur 3, le système consigne les statistiques de performances, ainsi que tous les messages SQL.
La valeur par défaut, 0, signifie que par défaut, aucun message n'est envoyé dans le journal de débogage SQL.

Paramètres de la section [OAC]

Définit les paramètres de configuration de la correction d'adresse intégrée au traitement du pipeline.
Remarque : Chaque fonctionnalité du logiciel est fournie par des éditeurs de logiciels indépendants et font l'objet d'un octroi de licence distinct par ces éditeurs.
AddrConnection
Spécifie l'identificateur URI utilisé par le logiciel de correction d'adresse. La valeur doit utiliser la syntaxe spécifique suivante :
prodtype://host:portnumbers
prodtype
  • Si vous utilisez IBM WebSphere QualityStage, spécifiez waves .
  • Si vous utilisez le logiciel Universal Coder de Group 1 Software, indiquez la valeur g1unc.
  • Si vous utilisez le logiciel CODE-1 Plus de Group 1 Software, spécifiez la valeur g1cs.
    Remarque : Si vous optez pour une transition entre un produit Group 1 Software vers IBM WebSphere QualityStage, contactez votre représentant Professional Services ou le service de support logiciel IBM pour réaliser la transition, étant donné que les différences entre les produits génèrent des adresses hachées distinctes.
host
Définit le nom de la machine hôte qui exécute le logiciel de correction d'adresse ou l'adresse IP du serveur hôte hébergeant le logiciel de correction d'adresse.
portnumbers
Spécifie les numéros de port utilisés par le logiciel de correction d'adresse. Vous pouvez définir le(s) numéro(s) de port par défaut pour le logiciel de correction d'adresse utilisé par votre système ou, si votre système est configuré en vue d'utiliser d'autres numéros de port, vous spécifiez ces derniers ici.
Cette liste contient les numéros de port par défaut répertoriés par logiciel de correction d'adresse :
  • Pour IBM WebSphere QualityStage, le numéro de port par défaut est 6010.
  • Pour Group1 Software Universal Coder, le numéro de port par défaut est 8080.
  • Pour Group1 Software CODE-1 Plus, les numéros de port par défaut sont :
    • CODE-1 Plus - Etats-Unis : us_port=3008.
    • CODE-1 Plus - Canada : can_port=3014.
    • CODE-1 Plus - Autres pays : int_port=3006.
Par défaut, la valeur de ces paramètres n'est pas renseignée.
GeoConnection
N'utilisez ce paramètre qu'avec Geographic CODE-1 Plus de Group 1 Software. Le paramètre définir le nom de l'hôte (ou l'adresse IP) et le numéro de port pour le produit Geographic Coding Plus de Group1 Software. Ce paramètre utilise une syntaxe spécifique :
prodtype://host:portnumber
prodtype
  • Utilisez g1cs
host
Nom de la machine hôte qui exécute le logiciel de correction d'adresse ou l'adresse IP du serveur hôte hébergeant le logiciel de correction d'adresse.
portnumber
Spécifiez le numéro de port de cette connexion ou utilisez la valeur par défaut 3010.
OverrideState
N'utilisez ce paramètre qu'avec les produits Group1 Software et si vous souhaitez que le système remplace la valeur d'un Etat américain par le code d'état à deux chiffres associé. Les valeurs admises sont Y et N :
  • Si ce paramètre est défini sur Y, la valeur entrante désignant un Etat américain est remplacée par le code d'état à deux chiffres correspondant.
  • Si ce paramètre est défini sur N, la valeur entrante désignant un Etat américain n'est pas remplacée et demeure inchangée.
La valeur par défaut est Y.

Paramètres de la section [MM]

Définit les paramètres de configuration pour une résolution d'entité.

DOBConfThreshold
Spécifie le seuil de concordance ou de discordance pour la date de naissance (DOB). L'évaluation de la date de naissance s'appuie sur une échelle de points numérotée de 0 à 100 et des algorithmes de résolution de dates de naissance. Ce paramètre définit le niveau de point à partir duquel les différences entre les dates de naissance deviennent des discordances.
Plus la valeur de seuil est élevée, plus faible est le score des différences entre les dates de naissance au stade de confirmation ou de discordance de la résolution d'entité.
La valeur par défaut est 90.
CircaDOBAttribute
Spécifie la valeur ATTR_TYPE_ID dans la table ATTR_TYPE pour indiquer une date de naissance approximative.
La valeur par défaut est 4. Toutefois, du fait que les dates de naissance approximatives sont rarement utilisées, ce paramètre par défaut est généralement mis en commentaire au moyen du signe dièse.
CircaRangeThreshold
Spécifie le nombre d'unités de différence admissibles entre une date de naissance (DOB) et une date de naissance approximative dans les limites de laquelle le système considère toujours la valeur comme une correspondance. Ce paramètre est utilisé en association avec le paramètre CircaRangeType.
La valeur par défaut est 1. La valeur par défaut du paramètre CircaRangeType est Y. Ensemble, ces paramètres indiquent que le nombre par défaut d'unités de différence entre une date de naissance et date de naissance approximative correspond à une année.
Toutefois, du fait que les dates de naissance approximatives sont rarement utilisées, ce paramètre par défaut est généralement mis en commentaire au moyen du signe dièse.
CircaRangeType
Indique le type d'une de seuil pour la date de naissance (DOB) approximative. Ce paramètre est utilisé avec le seuil CircaRangeThreshold.
Les valeurs admises sont M et Y :
  • Si ce paramètre est défini sur la valeur M, le seuil de date de naissance approximative est spécifié en mois.
  • Si ce paramètre est défini sur la valeur Y, le seuil de date de naissance approximative est spécifié en années.
La valeur par défaut, Y, signifie que le système utilise les années en tant que seuil de date de naissance approximative. La valeur par défaut de CircaRangeThreshold est 1. Ensemble, ces paramètres indiquent que le nombre par défaut d'unités de différence entre une date de naissance et date de naissance approximative correspond à une année.
Toutefois, du fait que les dates de naissance approximatives sont rarement utilisées, ce paramètre par défaut est généralement mis en commentaire au moyen du signe dièse.
DateRangeThreshold
Définit le nombre d'unités pour les seuils de date Depuis et Jusqu'à. Ce paramètre est utilisé en association avec le paramètre DateRangeType.
  • Si ce paramètre est défini sur la valeur -1, le traitement de toutes les dates Depuis et Jusqu'à est ignoré.
  • Si ce paramètre est défini sur la valeur 0, les dates Depuis et Jusqu'à sont utilisées comme spécifié.
  • Si ce paramètre est défini sur un nombre compris entre 1 et x, ce nombre représente l'écart maximal pour les plages de dates non concomitantes.
La valeur par défaut est 0. Ainsi, par défaut, le système traite les dates Depuis et Jusqu'à conformément aux spécifications du message UMF entrant. Ce paramètre est généralement mis en commentaire au moyen du signe dièse.
DateRangeType
Spécifie l'unité de seuil pour les plages de dates. Ce paramètre est utilisé en association avec le paramètre DateRangeType.
Les valeurs admises sont D, M et Y :
  • Si ce paramètre est défini sur la valeur D, le seuil de la plage de dates est spécifié en jours.
  • Si ce paramètre est défini sur la valeur M, le seuil de la plage de dates est spécifié en mois.
  • Si ce paramètre est défini sur la valeur Y, le seuil de la plage de dates est spécifié en années.
La valeur d'entrée par défaut est M. Ainsi, par défaut, le système traite les plages de date entrantes A partir de et Jusqu'à spécifiées en nombre de mois. Ce paramètre est généralement mis en commentaire au moyen du signe dièse.
LogDenials
Indique si les informations de discordance renvoyées par la résolution d'entité doivent être journalisées. Soit ce paramètre est mis en commentaire, soit il doit être entré manuellement.
Les valeurs admises sont Y et N :
  • Si ce paramètre est défini sur la valeur Y, le système consigne les discordances.
  • Si ce paramètre est défini sur la valeur N, le système ne consigne pas les discordances. Si ce paramètre est présent dans le fichier de configuration, la valeur par défaut est N.

Paramètres de la section [DSE]

Définit les paramètres de configuration pour la fonction du moteur d'évaluation dynamique. Cette fonctionnalité n'est pas utilisée sur certains pipelines.
Enabled (Activé)
Indique si le moteur d'évaluation dynamique est activé ou non. Les valeurs admises sont Y et N :
  • Si ce paramètre est défini sur la valeur Y, le moteur d'évaluation dynamique est activé sur le pipeline.
  • Si ce paramètre est défini sur la valeur N, le moteur d'évaluation dynamique est désactivé sur le pipeline.
La valeur par défaut est N.

Paramètres de configuration d'IBM Degrees of Separation

Lorsque vous installez IBM Degrees of Separation pour Relationship Resolution, vous pouvez configurer des paramètres complémentaires pour ce composant après son installation, ainsi que pour les informations associées. Si vous avez déjà installé le composant et ses informations, utilisez le lien situé dans l'arborescence de navigation du centre de documentation pour consulter ses paramètres de configuration.

IBM Entity Analytic Solutions Name Manager - Paramètres de configuration

Lorsque vous installez IBM Entity Analytic Solutions Name Manager, vous pouvez configurer des paramètres complémentaires pour ce composant après son installation, ainsi que pour les informations associées. Si vous avez déjà installé le composant et ses informations, utilisez le lien situé dans l'arborescence de navigation du centre de documentation pour consulter ses paramètres de configuration.

Référence associée
IBM Entity Analytic Solutions Name Manager - Paramètres de configuration du pipeline


Commentaires en retour

Dernière mise à jour : 2007