IM Centro de Informações do Relationship Resolution, Versão 4.2

Utilitário de Alteração de Rede

O utilitário de alteração de rede é uma ferramenta baseada em Java que compara dados novos de entrada com dados existentes da mesma origem.

O utilitário verifica registros de entrada em relação ao conjunto de dados existentes para determinar se cada registro de entrada é:

Utilize o utilitário de alteração de rede sempre que você tiver dados de entrada que repetem dados que você já tem. Por exemplo, se uma das alimentações de origem de dados mensais for uma origem de dados de diretório do telefone, talvez você queira verificar duplicações antes de carregar o novo arquivo, já que a maioria dos números de telefone não é alterada todo o mês.

A eliminação de registros duplicados impede que o utilitário de conversão ou os pipelines tenham que processá-los e pode reduzir o tempo total de processamento do sistema.

As configurações no arquivo de configuração descrevem os parâmetros de tempo de execução essenciais para os registros de comparação. As configurações que definem a largura do registro, os critérios de registro e uma chave de registro devem ser exatas para que o utilitário de alteração de rede seja bem-sucedido. Por exemplo, se o tamanho de arquivo total não for igualmente divisível pelo comprimento do registro mais o comprimento de preenchimento, o utilitário de alteração de rede exibirá um erro e parará.

O utilitário de alteração de rede compara um conjunto de registros de entrada com um conjunto de registros base existente. Isso cria um arquivo de diferença (.dif) que especifica quais registros representam um registro incluído, alterado, excluído ou visto. O utilitário cria um arquivo de mesclagem (.merge) que sobrescreve o conjunto de registros base original e que será utilizado como o próximo conjunto de registros base. O utilitário de alteração de rede pode então enviar o arquivo de diferença para o utilitário de conversão de arquivo UMF, ou outro utilitário de geração UMF ou, se a origem de dados fornecer os registros no formato UMF, diretamente para um pipeline.

O utilitário de alteração de rede executa dois tipos de comparação:

  1. Incremental: (Padrão) Utilize uma comparação incremental quando tiver conjuntos de dados de entrada incompletos: por exemplo, se você estiver carregando somente registros A-M hoje e registros N-Z amanhã. Dessa forma, os dados de entrada não alterarão os registros N-Z no arquivo base quando você estiver processando registros A-M hoje. Comparações incrementais:
    • Ignoram os registros ausentes no arquivo de origem, conforme comparado com o Arquivo Base.
    • Não marcam nenhum registro para exclusão no arquivo de diferença (.diff); Não excluem nenhum registro do novo arquivo base.
    • Para um bom funcionamento, não devem incluir o comutador --do-delete na linha de comandos.
  2. Comparação Total: Utilize uma comparação total quando os dados de entrada fornecerem todos os registros de um conjunto de dados todas as vezes e você quiser excluir quaisquer registros no banco de dados, mas estiver precisando dos dados de entrada. Comparações totais:
    • Avaliam os dados de entrada inteiros em relação ao arquivo base inteiro.
    • Marcam todos os registros ausentes da origem (comparados com o arquivo base). Registros marcados para exclusão serão excluídos do novo arquivo base.
    • Devem ser indicadas na linha de comandos através da inclusão do comutador --do-delete.
Tarefas relacionadas
Avaliando Novos Dados em Relação a Dados Existentes
Referências relacionadas
Comparação de Registros do Utilitário de Alteração de Rede


Feedback

Última atualização: 2007