O arquivo de configuração de pipeline (geralmente pipeline.ini) contém
os valores iniciais para variáveis e informações de configuração que os pipelines
precisam para processar dados de entrada. As configurações no arquivo de configuração de pipeline sobrescrevem as configurações do sistema global (como em parâmetros do sistema)
para todos os pipelines que utilizam o mesmo arquivo de configuração de pipeline.
Você pode incluir ou alterar parâmetros ou valores manualmente no arquivo de configuração de pipeline. No entanto, fazendo isso, é possível que você corrompa esse arquivo, crie uma configuração inválida ou cause a interrupção do processamento do pipeline.
Antes de fazer qualquer alteração no arquivo de configuração do pipeline, faça uma cópia do arquivo por questões de segurança.
Parâmetros da Seção [pipeline]
Contém dados de configuração
para os pipelines. Não renomeie o cabeçalho desta seção; ele deve permanecer como
[pipeline] ou os pipelines utilizando o arquivo de configuração serão encerrados
com um erro.
- CMEAdminTransport
- Especifica o URI (Uniform Resource Identifier) HTTP do transporte para o Console de Configuração, que é o componente que contém o monitor de aplicativos. Você pode utilizar o monitor de aplicativos para monitorar o status e as
estatísticas do pipeline e para rotear resultados dos pipelines.
- O valor padrão é vazio. Geralmente essa configuração é comentada.
- InputTransport
- Especifica o URI do transporte onde o pipeline recebe dados de
entrada. Se o transporte especificado não existir, o sistema não inicia o pipeline ou encerra o pipeline.
- Você pode especificar vários transportes utilizando um espaço em branco entre URIs.
- O valor padrão é vazio. Geralmente essa configuração é comentada, pois os transportes de entrada costumam ser especificados na linha de comandos quando os pipelines são iniciados.
- Simultaneidade
- Especifica o número de encadeamentos de processamentos de pipeline paralelos simultâneos gerados quando um único processo de pipeline é iniciado. Esse parâmetro
pode ser qualquer inteiro positivo maior que ou igual a 0. Quanto maior o número, mais encadeamentos de processamentos de pipeline são iniciados com cada comando
pipeline start e mais registros de dados de entrada podem ser processados ao
mesmo tempo. (Um registro é processado por cada encadeamento de processamentos
paralelos.)
- Essa configuração tem precedência sobre a configuração do parâmetro do sistema DEFAULT_CONCURRENCY especificada na guia Parâmetros do Sistema
no Console de Configuração.
- Se o recurso do sistema do mecanismo de contagem dinâmico estiver ativado na seção
[DSE], esse número máximo de simultaneidade deve ser configurado como 1. O recurso do mecanismo de contagem dinâmico não pode utilizar o recurso de processamento de pipeline paralelo.
- O valor padrão é 1, o que significa que somente 1 encadeamento de processamento de pipeline é gerado com cada comando pipeline start. No entanto, você pode substituir esse valor padrão
especificando o número de simultaneidade no parâmetro de transporte do comando pipeline start.
- ErrorLimit
- Especifica o número de erros que o sistema pode encontrar durante o processamento
em um período de 24 horas antes de encerrar o pipeline que está encontrando os erros. Esse limite de erros inclui erros de banco de dados, erro de pipeline, erros de fila ou erros de análise de UMF. Se esse valor de configuração for 0, os pipelines nunca serão encerrados, independentemente do número de erros encontrados.
- Erros de exceção de UMF não são incluídos nessa configuração de limite de erros. Os limites de erros de exceção de UMF são configurados utilizando os parâmetros LogOnAllUMFExceptions e StopOnAllUMFExceptions
- Essa configuração interage com o parâmetro ErrorRestInterval.
- O valor padrão é configurado como 10.
- ErrorResetInterval
- Especifica o número de minutos que o sistema conta os erros que se aplicam ao
parâmetro ErrorLimit antes de reconfigurar a contagem de erros para o pipeline.
- Se o número especificado de minutos expirar sem o sistema exceder a contagem de ErrorLimit, o sistema reconfigura o número de erros contados para esse pipeline.
- Se o sistema exceder o número de erros especificado no parâmetro de Limite de Erros antes do número de minutos especificado no parâmetro ErrorResetInteral, o sistema encerra o pipeline afetado.
- O valor padrão é configurado como 1440.
- LogOnAllUMFExceptions
- Indica se exceções do UMF são registradas no arquivo de log do pipeline, *.msg
em que * é o nome do pipeline onde ocorreu a exceção.
Os valores válidos são Y ou N:
- Se esse parâmetro for configurado como Y, todos os dados de entrada que geram exceções
do UMF são colocados em um arquivo de log *.msg e a exceção é registrada na tabela UMF_EXCEPT.
- Se o parâmetro for configurado como N, o sistema não registra exceções do UMF
em um arquivo de log *.msg. No entanto, as exceções ainda estão registradas na tabela UMF_EXCEPT.
- Essa configuração interage com a configuração StopOnAllUMFExceptions.
- O valor padrão é configurado como Y.
- StopOnAllUMFExceptions
- Indica se o sistema pára ou não de processar dados de entrada e encerra o pipeline quando encontra uma exceção do UMF. Os valores válidos são Y ou N:
- Se esse parâmetro for configurado como Y, o sistema pára automaticamente de processar todos os dados de entrada quando o primeiro erro do UMF for encontrado e encerra o pipeline. Normalmente essa configuração é utilizada durante implementações iniciais para reunir informações adicionais sobre exceções do UMF de entrada.
- Se esse parâmetro for configurado como N, mas o parâmetro LogOnAllUMFExceptions for
configurado como Y, o sistema registra a exceção do UMF no arquivo de log UMF e continua
processando os dados de entrada. Os dados envolvidos na exceção do UMF não são processados, o que significa que você deve revisar o log da exceção do UMF para localizar o problema com o UMF,
corrigir os dados e depois recarregar o registro do UMF inteiro em um pipeline para processamento.
- Se esse parâmetro estiver configurado como N e o parâmetro LogOnAllUMFExceptions estiver configurado como N, o pipeline conclui um carregamento parcial de dados, carregando somente os dados que não estão incluídos na exceção do UMF. Os dados incluídos na exceção do UMF não são processados, o que significa que você deve revisar o log da exceção do UMF para localizar o problema com o UMF, corrigir os dados e depois recarregar os dados corrigidos em um pipeline
para processamento.
- O valor padrão é configurado como N e o valor padrão para o parâmetro LogOnAllUMFExceptions
é configurado como Y. Isso significa que, por padrão, o sistema registra a exceção do UMF no arquivo de log UMF e não processa o registro dos dados de entrada com o erro de UMF.
Parâmetros da Seção [SQL]
Define a configuração para a conexão com o banco de dados entre os pipelines e o banco de dados da entidade.
- Conexão
- Especifica o URI (Universal Resource Indicator) para pipelines para conexão com o banco de dados da entidade. Casa tipo de banco de dados utiliza uma sintaxe diferente específica, mas a sintaxe é indicada da seguinte forma:
- type://user:password@database/?timeout=N
- Para especificar uma conexão com o banco de dados do DB2
- db2://user:password@database/?timeout=N/?schema=schemaname
- onde
- db2:// indica o tipo de banco de dados
- user:password@database especifica
o login (nome do usuário e senha) para acessar o banco de dados especificado
- /?timeout=N é o tempo (em segundos) que o pipeline aguarda uma resposta do banco de dados antes de exceder o tempo limite
- e /?schema=schemaname é o nome
de um esquema customizado do DB2. (Essa configuração é opcional e é normalmente utilizada quando você quer especificar um esquema de banco de dados não padrão ou customizado do DB2).
Nota: O recurso de esquema customizado do DB2 não é compatível com o gerador de relatórios no Visualizador e no Console de Configuração.
Se você especificar um esquema customizado do DB2, os relatórios do Visualizador e do Console de Configuração não funcionarão.
- Para especificar uma conexão com o banco de dados Oracle
- oci://user:password@SID
- em que user password especifica o
login (nome do usuário e senha) para acessar o banco de dados
- SID corresponde ao conjunto de parâmetros SID para este banco de dados Oracle.
- e /?timeout=N é o tempo (em segundos) que o pipeline aguarda por uma resposta do banco de dados antes de exceder seu tempo limite
- Para especificar uma conexão com o banco de dados do servidor Microsoft SQL
- mssql://user.password@DSN
- em que user password especifica o
login (nome do usuário e senha) para acessar o banco de dados
- e DSN corresponde ao conjunto de parâmetros DSN para esse banco de dados do Microsoft SQL Server.
- e /?timeout=N é o tempo (em segundos) que o pipeline aguarda por uma resposta do banco de dados antes de exceder seu tempo limite
- O valor padrão é vazio.
- LogTable
- Especifica a tabela para utilizar quando o sistema registra mensagens do UMF. Utilize esse parâmetro se você tiver vários pipelines enviando dados para o mesmo banco de dados da entidade; cada pipeline precisa gravar informações de log em tabelas separadas.
- Se você especificar uma tabela diferente do valor padrão da UMF_LOG, será necessário criar a
nova tabela no banco de dados e essa tabela deverá conter os mesmos campos que a tabela UMF_LOG.
- DeadLockRetries
- Especifica o número de novas tentativas que o sistema faz durante o processamento de uma mensagem de entrada do UMF após o pipeline atingir seu tempo limite ou exceder condições de conflito. Se esse número for excedido, o pipeline é encerrado.
- O valor padrão é configurado como 3, mas geralmente é comentado utilizando o sinal de sustenido.
- DebugLevel
- Controla o nível de detalhes das mensagens enviadas para o log de depuração SQL, *.SqlDebug.log,
em que * é o nome do nó pipeline configurado para o modo de depuração. Os valores válidos incluem:
- Se esse parâmetro for configurado como 0, nenhum log será criado. Utilize somente para depuração.
- Se esse parâmetro for configurado como 1, o sistema registra estatísticas de desempenho.
- Se esse parâmetro for configurado como 2, o sistema registra todas as mensagens SQL.
- Se esse parâmetro for configurado como 3, o sistema registra todas as estatísticas de desempenho e registra todas as mensagens SQL.
- O valor padrão é configurado como 0, o que significa que por padrão nenhuma mensagem é enviada para o log de depuração SQL.
Parâmetros da Seção [OAC]
Define os parâmetros de configuração para correção de endereço que está integrada no processamento de pipelines.
Nota: Cada recurso
do software é oferecido por independent software vendors e licenciado separadamente por eles.
- AddrConnection
- Especifica o URI para o software de correção de endereço. O valor deve utilizar uma sintaxe específica:
- prodtype://host:portnumbers
- prodtype
- Se você utilizar o IBM WebSphere QualityStage,
utilize waves .
- Se você utilizar Group 1 Software Universal Coder, configure como g1unc.
- Se você utilizar Group 1 Software CODE-1 Plus, configure como g1cs.
Nota: Se você optar por mudar de um produto Group 1 Software para o IBM WebSphere QualityStage, entre em contato com o Contato para Serviços
Profissionais para obter ajuda para fazer a transição, pois existem diferenças no produto que produz hashes de endereço diferentes.
- host
- Especifica o nome da máquina host que executa o software de correção de endereço ou endereço IP do servidor host para o software de correção de endereço.
- portnumbers
- Especifica os números de porta a serem utilizados para o software de correção de endereço.
Você pode utilizar o(s) número(s) de porta padrão para o software de correção de endereço que seu sistema utiliza ou se seu sistema estiver configurado para utilizar números de porta, você especifica esses números de porta aqui.
- Essa lista contém os números de porta padrão por software de correção de endereço:
- Para IBM WebSphere QualityStage, o número de porta padrão é 6010.
- Para Group1 Software Universal Coder, o número de porta padrão é 8080.
- Para Group1 Software CODE-1 Plus, os números de porta padrão são:
- Para United States CODE-1 Plus: utilize us_port=3008.
- Para Canadian CODE-1 Plus: utilize can_port=3014.
- Para International CODE-1 Plus: utilize int_port=3006.
- O valor padrão para esses parâmetros fica vazio.
- GeoConnection
- Utilize este parâmetro somente se estiver utilizando o Group 1 Software Geographic CODE-1
Plus. O parâmetro especifica o nome do host (ou endereço IP) e o número da porta para o produto Group1 Software Geographic Coding Plus. Essa configuração utiliza uma sintaxe específica:
- prodtype://host:portnumber
- prodtype
-
- host
- O nome da máquina host que executa o software de correção de endereço ou endereço IP do servidor host para o software de correção de endereço.
- portnumber
- Especifica o número da porta para esta conexão ou utiliza o valor padrão de 3010.
- OverrideState
- Utilize este parâmetro somente se estiver utilizando o Group1 Software e quiser que o sistema substitua o valor do estado de entrada United States pelo código de estado de dois dígitos associado. Os valores válidos são Y ou N:
- Se esse parâmetro estiver configurado como Y, o valor do estado de entrada United States será substituído por seu código de estado de dois dígitos associado.
- Se esse parâmetro estiver configurado como N, o valor do estado de entrada United States não será substituído e será deixado como está.
- O valor padrão é configurado como Y.
Parâmetros da Seção [MM]
Define os parâmetros de configuração para a resolução da entidade.
- DOBConfThreshold
- Especifica o limite para a confirmação ou negação da DOB (data de nascimento).
O score DOB é uma escala de pontos de zero a 100, com base em algoritmos de resolução de
data de nascimento. Esse parâmetro configura o nível de pontos em que as diferenças de data de data de nascimento se tornam negações.
- Quando maior o número limite, menor pode ser a diferença entre as datas de nascimento
para um score alto durante o estágio de confirmação ou negação da resolução da entidade.
- O valor padrão é configurado como 90.
- CircaDOBAttribute
- Especifica o valor ATTR_TYPE_ID na tabela ATTR_TYPE que indica uma data de nascimento aproximada.
- O valor padrão é configurado como 4. No entanto, como datas de nascimento aproximadas são utilizadas sem muita freqüência, essa configuração padrão geralmente é comentada utilizando-se um sinal de sustenido.
- CircaRangeThreshold
- Especifica o número de unidades em que uma DOB (data de nascimento) pode se diferir de uma DOB aproximada e ainda serem consideradas pelo sistema como valores correspondentes. Esse limite é utilizado com o parâmetro CircaRangeType.
- O valor padrão é configurado como 1. O parâmetro padrão CircaRangeType é configurado como Y. Juntos, esses parâmetros indicam que o número de unidades padrão em que um data
de nascimento pode ser diferente de uma data de nascimento aproximada é de 1 ano.
- No entanto, como datas de nascimento aproximadas são utilizadas sem muita freqüência, essa configuração padrão geralmente é comentada utilizando-se um sinal de sustenido.
- CircaRangeType
- Indica o tipo de unidade limite para a DOB (data de nascimento) aproximada.
Esse parâmetro é utilizado com o limite CircaRangeThreshold.
- Os valores válidos são M ou Y:
- Se esse parâmetro for configurado como M, o limite da DOB aproximada estará em meses.
- Se esse parâmetro for configurado como Y, o limite da DOB aproximada estará em anos.
- O valor padrão é configurado como Y, o que significa que o sistema utiliza anos como o limite da data de nascimento aproximada. O valor padrão de CircaRangeThreshold é configurado como 1. Juntos, esses parâmetros indicam que o número de unidades padrão em que uma data de nascimento pode ser diferente de uma data de nascimento aproximada é de 1 ano.
- No entanto, como datas de nascimento aproximadas são utilizadas sem muita freqüência, essa configuração padrão geralmente é comentada utilizando-se um sinal de sustenido.
- DateRangeThreshold
- Especifica o número de unidades para os limites de data De e A.
Esse parâmetro é utilizado com o parâmetro DateRangeType.
- Se esse parâmetro for configurado como -1, desconsidere todos os processamentos de data De e A.
- Se esse parâmetro for configurado como 0, utilize as datas De e A conforme fornecido.
- Se esse parâmetro for configurado como um número entre 1 e x, o número representará o tamanho de intervalo máximo para intervalos de data não sobrepostos.
- O valor padrão é configurado como 0. Portanto, por padrão, o sistema processa as datas De e A conforme especificado na mensagem de entrada do UMF. Essa configuração geralmente é comentada utilizando-se um sinal de sustenido.
- DateRangeType
- Especifica a unidade para o limite de intervalo de data. Esse parâmetro é utilizado com
DateRangeThreshold.
- Os valores válidos são D, M ou Y:
- Se esse parâmetro for configurado como D, o limite do intervalo de data estará em dias.
- Se esse parâmetro for configurado como M, o limite do intervalo de data estará em meses.
- Se esse parâmetro for configurado como Y, o limite do intervalo de data estará em anos.
- A entrada padrão é configurada como M. Portanto, por padrão, o sistema processa intervalos de data de entrada De e A em meses. Essa configuração geralmente é comentada utilizando-se um sinal de sustenido.
- LogDenials
- Especifica se informações de negação devem ser registradas a partir da resolução da entidade. Essa configuração é comentada ou deve ser inserida manualmente.
- Os valores válidos são Y ou N:
- Se esse parâmetro for configurado como Y, o sistema registra negações.
- Se esse parâmetro for configurado como N, o sistema não registra negações. Se essa configuração estiver presente no arquivo de configuração, o valor padrão será N.
Parâmetros da Seção [DSE]
Define os parâmetros de configuração para a funcionalidade do mecanismo de contagem dinâmico. Essa funcionalidade pode não ser utilizada por todos os pipelines.
- Ativado
- Indica se a funcionalidade do mecanismo de contagem dinâmico está ou não ativada. Os valores válidos são Y ou N:
- Se esse parâmetro for configurado como Y, a funcionalidade do mecanismo de contagem dinâmico é ativada no pipeline.
- Se esse parâmetro for configurado como N, a funcionalidade do mecanismo de contagem dinâmico é desativada no pipeline.
- O valor padrão é configurado como N.
Parâmetros de Configuração do IBM Degrees of Separation
Quando instala o IBM Degrees of Separation para Relationship Resolution, você pode configurar parâmetros adicionais para esse componente após instalá-lo e também suas informações associadas. Caso já tenha instalado o componente e suas informações, utilize o link na árvore de navegação do Centro de Informações para revisar seus parâmetros de configuração.
Parâmetros de Configuração do IBM Entity Analytic Solutions Name Manager
Quando instala o IBM Entity Analytic Solutions Name Manager, você pode configurar parâmetros adicionais para esse componente após instalá-lo e também suas informações
associadas. Caso já tenha instalado o componente e suas informações, utilize o link na árvore de navegação do Centro de Informações para revisar seus parâmetros de configuração.