Centro de Data Warehouse Guia de Administração

Transformando tabelas de destino

Use os transformadores do warehouse para efetuar as seguintes transformações de dados básicas:

Limpando dados

Use o transformador Limpar Dados para executar em uma tabela operações de procura e substituição baseadas em regras. O transformador procura valores especificados nas colunas de dados da tabela de origem que a etapa acessa. Então, ele atualiza as colunas correspondentes com valores de substituição especificados na tabela na qual a etapa grava. Você pode selecionar várias colunas na tabela de entrada para transportar para a tabela de saída. O transformador Limpar Dados não define regras ou parâmetros para as colunas de transporte.

Use o transformador Limpar Dados para limpar e padronizar valores de dados após carregar ou importar, como parte de um processo. Não use o transformador como editor de coluna de dados de finalidade geral.

O transformador Limpar Dados serve para fazer as seguintes tarefas:

Você pode usar o transformador Limpar Dados somente se a tabela de origem e a tabela de destino estiverem no mesmo banco de dados. A tabela de origem deve ser uma única tabela de warehouse. A tabela de destino é a tabela de destino padrão.

Você pode optar por ignorar maiúscula/minúscula e espaço em branco ao localizar cadeias e pode-se especificar um valor de tolerância para dados numéricos.

Você pode fazer alterações na etapa somente quando ela estiver no modo de desenvolvimento.

Toda transformação de limpeza especificada usa um destes quatro tipos de limpeza:

Procurar e Substituir
Realiza as funções básicas de procura e substituição.

Discretizar
Realiza as funções básicas de procura e substituição dentro de um intervalo de valores.

Recortar
Realiza funções básicas de procurar e substituir dentro de um intervalo de valores ou fora dele.

Transportar
Especifica colunas na tabela de entrada para serem copiadas para a tabela de saída.

Pré-requisito: Para poder usar o transformador Limpar Dados, você deve criar uma tabela de regras para seu tipo de limpeza. Uma tabela de regras designa os valores que o transformador Limpar Dados usará durante o processo de procura e substituição. Ela deve estar no mesmo banco de dados que a tabela de origem e a tabela de destino.

Criando uma tabela de regras para um transformador de limpeza

No mínimo, uma tabela de regra deve conter pelo menos duas colunas. Uma coluna contém valores de procura. A outra contém valores de substituição. As linhas de cada coluna se correspondem.

Por exemplo, a Coluna 1 e a Coluna 2 de uma tabela de regras têm os valores mostrados aqui:
Coluna 1 Coluna 2
Mesa Cadeira
Tabela Abajur

Suponha que a coluna 1 inclui os valores de procura e a coluna 2, os valores de substituição. Quando você executa a etapa, o transformador Limpar Dados procura a coluna de origem do valor Mesa. Sempre que ele encontrar o valor Mesa, ele gravará o valor Cadeira no campo correspondente da coluna de destino.

O transformador Limpar Dados copia os valores que não estão relacionados diretamente na coluna de procura para a tabela de destino. No exemplo, o valor Banco não está relacionado na coluna que contém os valores de procura. Caso a coluna de origem selecionada contenha o valor Banco, o Transformador de Limpeza gravará Banco no campo correspondente da coluna de destino.

A tabela a seguir descreve as colunas que devem ser incluídas na tabela de regras de cada tipo de limpeza:
Tipo limpeza Número mínimo de colunas da tabela de regras Propósito das colunas
Procurar e substituir 2 - 3

A primeira coluna contém valores de procura.

A segunda coluna contém valores de substituição.

A terceira coluna, se especificada, conterá as informações de ordenação da regra e não será obrigatória.

Discretizar 3 - 4

A primeira coluna contém o limite inferior do intervalo de valores de procura.

A segunda coluna contém o limite superior do intervalo de valores de procura.

A terceira coluna contém o valor de substituição.

A quarta coluna, se especificada, conterá as informações de ordenação da regra e não será obrigatória.

Colar 3 - 5

A primeira coluna contém o limite inferior do intervalo de valores de procura.

A segunda coluna contém o limite superior do intervalo de valores de procura.

A terceira coluna contém o limite inferior do valor de substituição.

A quarta coluna contém o limite superior do valor de substituição.

A quinta coluna, se especificada, conterá as informações de ordenação da regra e não será obrigatória.

Dica: Ao usar o tipo de limpeza Clip, você pode executar o procedimento procurar e substituir que pesquisa fora dos intervalos de valores.

Transportar Não permitido Tabela de regra não utilizada

Você pode reordenar as colunas de saída usando o bloco de notas Etapa. Você pode alterar os nomes das colunas na página Mapeamento da Coluna do bloco de notas Etapa.

Definindo o transformador Limpar Dados

Para definir um transformador Limpar Dados:

  1. Abra o bloco de notas da etapa.
  2. Especifique informações gerais sobre o transformador. Para obter mais informações, consulte o manual Fornecendo informações gerais sobre uma etapa.
  3. Na página Parâmetros, defina as transformações de limpeza a serem executadas quando a etapa for realizada. Clique o botão direito do mouse em um ponto qualquer da tabela de definição do Transformador e clique em Incluir. Uma linha é incluída na tabela.
  4. Sob o título de coluna Entrada, da linha que acaba de ser incluída, clique e selecione o nome da coluna que contém os dados que serão limpos.
  5. Na lista Tipo de limpeza, selecione o tipo de transformação de limpeza que vai ser efetuado na coluna de entrada quando a etapa for executada.

    Para copiar sua coluna de entrada para a tabela de destino sem fazer nenhuma alteração, clique em Transportar. A lista Regras e a lista Parâmetro não ficam disponíveis. Prossiga para a etapa 7.

  6. Na lista Regras, clique em ... para especificar a tabela de regras que a etapa vai usar para o tipo de limpeza selecionado. Uma janela é aberta. Os campos nela variam dependendo da seleção feita. Use essa janela para definir regras para o tipo de limpeza selecionada:
  7. Na coluna Parâmetros, clique em .... Dependendo do tipo de dados especificado para a coluna no campo Coluna de entrada, será aberta a janela Parâmetros da Cadeia ou Parâmetros Numéricos.

    Use os controles da janela Parâmetros da Cadeia para personalizar o modo como o transformador Limpar Dados realizará as tarefas de procura e substituição. Para especificar informações sobre os parâmetros da cadeia:

    1. Na área Especificar definições da cadeia, selecione a opção que se aplica a:
      • Comprimir espaço em branco. Espaços em branco à esquerda e à direita são removidos. Dois ou mais espaços internos consecutivos são comprimidos em um.
      • Ignorar espaço em branco durante a correspondência. O espaço em branco é removido da coluna de entrada e das colunas procurar, limite superior e limite inferior.
      • Ignorar maiúsculas/minúsculas. A distinção maiúsculas/minúsculas é ignorada quando o transformador Clean faz o processamento de procura das respostas.
      • Não copie o valor se ele corresponder a uma coluna da tabela de regras. O valor não é copiado se corresponder a coluna da tabela de regras.
    2. No campo Caractere de escape, digite um caractere de escape. Especifique, por exemplo, \. Não podem ser usados os caracteres % e _. Campo vazio não sugere que caractere em branco seja caractere de escape.
    3. Clique em OK para salvar suas alterações e fechar a janela.

    Use os controles da janela Parâmetros Numéricos para especificar uma tolerância numérica para sua transformação. O valor padrão é 0.0. Tolerância numérica é um número que é aplicado a valores de procurar numéricos. Permite a substituição de um valor que caiu, por pouco, fora de um valor de procurar ou de um intervalo de valores de procurar. Use, por exemplo, o tipo de limpeza Discretizar para substituir os limites numéricos do valor de procurar, procedendo da seguinte maneira: 23,50 -24,50 substituído por 1000. Quando se especifica uma tolerância de 0,10, os dados de entrada de 23,40 e 24,60 também seriam substituídos por 1000.

    Para especificar uma tolerância numérica:

    1. No campo tolerância Numérica, digite uma tolerância numérica.
    2. Para que o transformador Limpar Dados copie um valor se ele corresponder a uma coluna da tabela de regras, selecione a caixa de seleção Não copiar registro para saída se for encontrada correspondência de regra.
    3. Clique em OK para salvar suas alterações e fechar a janela.
  8. Defina tantos tipos de limpeza quantos forem desejados. Ao terminar, clique na guia Mapeamentos de Coluna. Para modificar seus mapeamentos de coluna, consulte o Definindo as informações do mapeamento de coluna.
  9. Na página Opções de Processamento, forneça informações sobre como sua etapa é processada. Para obter mais informações, consulte o manual Definindo as opções de processamento.
  10. Clique em OK para salvar as alterações e feche o bloco de notas etapa.

Gerando colunas chave

Use o transformador Gerar Tabela-Chave para incluir uma chave exclusiva em uma tabela do warehouse.

Você pode alterar valores na coluna-chave de duas formas:

O transformador Gerar Tabela Chave usa um warehouse de destino como origem. Ele grava numa tabela do warehouse de destino. Antes de definir esta etapa, ligue o warehouse de destino à etapa da janela Modelo de Processo, com a seta apontando para a etapa. Você pode fazer alterações na etapa somente quando ela estiver no modo de desenvolvimento.


Figure db2db030 not displayed.

O mapeamento da coluna não está disponível para esta etapa.

Para definir um transformador Gerar tabela chave:

  1. Abra o bloco de notas da etapa.
  2. Especifique informações gerais sobre o transformador. Para obter mais informações, consulte o manual Fornecendo informações gerais sobre uma etapa.
  3. Na página Parâmetros, a partir da lista Colunas disponíveis, clique na coluna à qual deseja atribuir valores chave. Em seguida clique em >. A coluna selecionada não precisa ser uma coluna de chave primária.


    Figure db2db029 not displayed.

  4. Especifique se quer atualizar valores na coluna chave com base numa coluna da etapa selecionada ou se quer substituir todos os valores da coluna chave na coluna chave que já existe.

    Para atualizar valores na coluna chave com base numa coluna de uma etapa selecionada:

    1. Clique em Atualizar os valores na coluna chave.
    2. Na lista Nome da tabela do valor chave, selecione uma tabela no warehouse de destino que contenha a tabela de destino. A tabela selecionada tem que conter a coluna em que os valores chave gerados serão baseados.
    3. Na lista Nome da coluna, clique numa coluna da tabela que acaba de ser especificada, na qual os valores chave gerados serão baseados.
    4. No campo Incrementar valor chave por, digite um valor de incremento numérico.

    Para substituir todos os valores de coluna chave na coluna chave que já existe:

    1. Clique em Substituir todos os valores da coluna chave.
    2. Digite um valor de coluna chave inicial no campo Iniciar valor chave em.
    3. Digite um valor de incremento numérico no campo Incrementar valor chave por.
  5. Na página Opções de Processamento, forneça informações sobre como sua etapa é processada. Para obter mais informações, consulte o manual Definindo as opções de processamento.
  6. Clique em OK para salvar as alterações e feche o bloco de notas etapa.

Gerando tabela de período

Utilize o transformador Gerar Tabela de Período para criar uma tabela de período que contenha colunas de informações de data que podem ser usadas na avaliação de outros dados, como determinação de volume de vendas dentro de um determinado período.

Pode-se usar uma tabela de período de várias formas:

O transformador Gerar Tabela de Período funciona apenas em tabelas de destino. Para usar o transformador com sucesso, conecte-o a um destino.


Figure db2db031 not displayed.

Só é possível fazer alterações na definição da etapa quando ela está no modo de desenvolvimento.

Para definir um transformador Gerar Tabela de Período:

  1. Abra o bloco de notas da etapa.
  2. Especifique informações gerais sobre o transformador. Para obter mais informações, consulte o manual Fornecendo informações gerais sobre uma etapa.
  3. Na página Parâmetros, lista Resolução, clique na resolução da coluna de data, hora ou registro de hora correspondente à tabela de período.


    Figure db2db032 not displayed.

  4. Especifique o valor do período de início selecionando a caixa de seleção de data, de hora ou em ambas. Então, defina a data ou hora de início (ou ambas):
  5. Especifique o valor do período de encerramento usando o número de linhas ou usando uma data e hora de encerramento, ou ambas:
  6. Opcional: Na página Mapeamento de Coluna, exiba ou altere os mapeamentos da coluna. Para obter mais informações, consulte o manual Definindo as informações do mapeamento de coluna.
  7. Na página Opções de Processamento, forneça informações sobre como sua etapa é processada. Para obter mais informações, consulte o manual Definindo as opções de processamento.
  8. Clique em OK para salvar as alterações e feche o bloco de notas etapa.

Invertendo dados

Use o transformador Inverter Dados para inverter a ordem das linhas e colunas de uma tabela. Quando se usa o transformador Inverter Dados, as linhas da tabela de origem se tornam colunas na tabela de saída e as colunas da tabela de entrada se tornam linhas na tabela de saída. A ordem dos dados entre as colunas, de cima para baixo, é mantida e colocada nas linhas, da esquerda para a direita.

Consideremos, por exemplo, a tabela de entrada como matriz. O transformador permuta os dados da tabela em torno de uma linha diagonal que desce do canto superior esquerdo para o canto inferior direito da tabela. Depois o transformador grava os dados transformados na tabela de destino.

Pode-se especificar uma coluna a mais que contenha dados ordinais que comecem pelo número 1. Ela ajuda a identificar as linhas depois de o transformador inverter a tabela.

Também é possível especificar na tabela de origem uma coluna a ser usada como nome de coluna na tabela de saída. Essa coluna se chama coluna central.

Os dados colunares de cada grupo central têm que estar ou no mesmo tipo de dados ou no mesmo tipo de data segundo o qual são relacionados entre si por meio da promoção automática. Mais informações sobre a promoção automática dos tipos de dados podem ser encontradas no IBM DB2 Universal Database: SQL Reference.

Pré-requisito: Antes de iniciar esta tarefa, é preciso conectar uma tabela de origem do banco de dados do warehouse à etapa. Também é possível especificar a tabela de destino na qual a etapa vai gravar ou determinar que a etapa crie a tabela de destino.

O transformador Inverter Dados elimina a tabela de banco de dados existente e a recria durante cada execução. Toda vez que você executar uma etapa usando esse transformador, os dados existentes serão substituídos, mas os nomes do table space e do table index serão preservados.

A etapa que usa o transformador Inverter Dados tem que ser promovida para o modo de produção para que os verdadeiros dados produzidos possam ser vistos.

Esta etapa não usa a página Mapeamento da Coluna.

Para definir um transformador Inverter Dados:

  1. Abra o bloco de notas da etapa.
  2. Especifique informações gerais sobre o transformador. Para obter mais informações, consulte o manual Fornecendo informações gerais sobre uma etapa.
  3. Na página Parâmetros, lista Colunas disponíveis, clique no nome da coluna que contém nomes de coluna da tabela de destino. Depois, clique em > para mover a coluna selecionada até o campo Coluna Principal. Os dados da coluna têm que ter um ou mais dos seguintes tipos de dados:


    Figure db2db033 not displayed.

    Todos os dados da coluna central têm que ter menos de 18 caracteres. Os caracteres alfabéticos são alterados para letras maiúsculas nos sistemas DB2 que requerem nomes de objetos em letras maiúsculas.

    Se você não selecionar uma coluna, o transformador assumirá que a tabela contém apenas dados brutos, os quais devem ser todos invertidos. Então, ele criará nomes de coluna para a tabela de destino com base no número da coluna. A primeira coluna será chamada 1, a segunda 2 e assim por diante.

  4. Opcional: Selecione a caixa de seleção Incluir coluna de seqüência na saída para criar uma coluna na tabela de saída que contenha uma lista ordenada de números. A lista de números inicia em 1 e é incrementada em 1.
  5. Se sua etapa não estiver conectada à tabela de destino, selecione Criar tabela de destino do warehouse baseado em parâmetros.
  6. Se a opção Criar tabela de destino do warehouse baseado em parâmetros tiver sido selecionada, selecione um warehouse de destino na lista Destino do Warehouse.
  7. Na página Opções de Processamento, forneça informações sobre como sua etapa é processada. Para obter mais informações, consulte o manual Definindo as opções de processamento.
  8. Clique em OK para salvar as alterações e feche o bloco de notas etapa.

Centralizando dados

Utilize o transformador de dados Centrais para agrupar dados relacionados de colunas selecionadas na tabela de origem, chamadas colunas principais, em uma única coluna, chamada de coluna do grupo principal, na tabela de destino. Você pode criar mais de uma coluna de grupo central.

Pode-se selecionar várias colunas na tabela de origem para serem transportadas para a tabela de saída. Os dados dessas colunas não são alterados pelo transformador Girar Dados.

Pode-se especificar uma coluna a mais que contenha dados ordinais que comecem pelo número 1. Ela ajuda a identificar as linhas depois de o transformador inverter a tabela.

Os dados colunares de cada grupo central têm que ter o mesmo tipo ou tipos de dados segundo qual são relacionados entre si pela promoção automática. Mais informações sobre a promoção automática dos tipos de dados podem ser encontradas no IBM DB2 Universal Database: SQL Reference.

Antes de iniciar essa tarefa, conecte uma tabela de origem do banco de dados do warehouse à etapa na janela Modelo de Processo. O transformador de Dados Centrais usa uma tabela de destino que já existe no mesmo banco de dados ou cria uma tabela de destino no mesmo banco de dados que contém a origem do warehouse. Só é possível fazer alterações na definição da etapa quando ela está no modo de desenvolvimento.


Figure db2db034 not displayed.

Para definir um transformador:

  1. Abra o bloco de notas da etapa.
  2. Especifique informações gerais sobre o transformador. Para obter mais informações, consulte o manual Fornecendo informações gerais sobre uma etapa.
  3. Clique na guia Parâmetros.


    Figure db2db035 not displayed.

  4. Opcional: Na lista Colunas disponíveis, clique na coluna a ser transportada para a tabela de destino sem fazer nenhuma modificação. Clique então em > ao lado da lista Transportar colunas. Para selecionar várias colunas, pressione Ctrl enquanto clica nelas.
  5. Na lista Colunas disponíveis, clique nas colunas que deseja usar como colunas principais. Clique então em > ao lado da lista Colunas Centrais.
  6. No campo Número de grupos centrais, digite o número de grupos principais a serem criados. O número que digitar deve ser um divisor do número de colunas centrais selecionadas. Por exemplo, se tiver selecionado 6 colunas principais, poderá digitar o número 1, 2, 3 ou 6. Se tiver selecionado 5 colunas, poderá digitar 1 ou 5 nesse campo.
  7. Se as colunas centrais tiverem sido selecionadas, especifique o grupo de dados e os grupos centrais de cada uma delas.
    1. Na página Parâmetros do bloco de notas do transformador de Dados Centrais, clique em Avançado. A janela Transformador de Dados Centrais - Avançado é aberta.


      Figure db2db036 not displayed.

      Use a tabela nessa janela para definir os grupos centrais. O número de linhas exibidas nessa tabela depende do número de colunas centrais selecionadas e do número de grupos centrais especificados na página Parâmetros. Por exemplo, se você tiver selecionado 6 colunas centrais e 2 grupos centrais, serão exibidas 3 linhas.

    2. Clique no campo Grupo de dados. Em seguida, digite um nome para um grupo de dados. Um grupo de dados é uma coluna na tabela de destino. Essa coluna é usada para descrever ou rotular informações coletadas em colunas de grupos centrais, para que o significado original dos dados, quando expressos pelos rótulos de coluna na tabela de entrada, sejam preservados na tabela de saída. Se o campo for deixado em branco e só houver um grupo central, os nomes das colunas centrais sofrerão rotação e irão para os campos de dados da coluna de saída que resulta quando a etapa é executada.
    3. Selecione uma coluna central para cada grupo central. O número de grupos centrais exibidos nessa tabela é o mesmo número de grupos centrais especificados na página Parâmetros. Para selecionar uma coluna central, dê um clique duplo no campo Grupo central e selecione uma coluna. Você não pode selecionar uma coluna para mais de um grupo central. É necessário selecionar uma coluna para cada campo em um grupo central.
    4. Clique em OK. A janela Transformador de Dados Centrais - Avançado é fechada.

    Se você fizer alterações nas colunas centrais selecionadas na janela Transformador de Dados Centrais, os valores dos grupos de dados e dos grupos centrais especificados nessa janela ficarão em branco.

  8. Para incluir uma coluna ordenada de números na tabela de saída, selecione a caixa de seleção Incluir coluna de seqüência na saída.
  9. Opcional: Na página Mapeamento da Coluna, exiba ou modifique os mapeamentos de coluna. Para obter mais informações, consulte o manual Definindo as informações do mapeamento de coluna.
  10. Na página Opções de Processamento, forneça informações sobre como sua etapa é processada. Para obter mais informações, consulte o manual Definindo as opções de processamento.
  11. Clique em OK para salvar as alterações e feche o bloco de notas etapa.

Alterando o formato de um campo de data

Use o transformador FormatDate para alterar o formato de um campo de data da tabela de origem que sua etapa está copiando para a tabela de destino padrão. Esse transformador pode ser executado com qualquer outro transformador ou programa do warehouse.

O transformador FormatDate fornece vários formatos padronizados de data que podem ser especificados para as colunas de entrada e saída. Se uma data da coluna de entrada não estiver igual ao formato especificado, o transformador gravará um valor nulo na tabela de saída.

Se o formato a ser usado não constar da lista Formato, digite um formato no campo Cadeia de formato da janela transformador. Digite, por exemplo, MMM D, AA se as datas de sua coluna de entrada tiverem a estrutura Mar 2, 96 ou Jul 15, 83.

O tipo de dados da coluna que está selecionada no campo Coluna de entrada determina o tipo de dados da coluna entrada de saída. Por exemplo:

Para usar o transformador FormatDate:

  1. Crie uma etapa que gere uma tabela de destino padrão num warehouse de destino em que os transformadores estejam instalados.
  2. Faça a ligação com a tabela de origem.
  3. Na página Instrução SQL, clique em Construir SQL.
  4. Clique na guia Colunas.
  5. Clique em Incluir.

    O Construtor de Expressões é aberto.

  6. No Construtor de Expressões, dê um clique duplo em FormatDate na lista de nomes da função.

    A janela Argumentos da Função - FormatDate é aberta.

  7. Na coluna da lista Colunas disponíveis, clique naquela que contém as informações de data e hora a serem reformatadas e depois clique em > para colocar o campo selecionado no Coluna de entrada.
  8. Especifique o formato de entrada na área Formato de Entrada da janela:
    1. Selecione uma categoria para os dados da coluna de entrada a partir da lista Categoria.
    2. Selecione um formato de data, hora ou registro de tempo a partir da lista Formato. A lista Exemplo mostra um exemplo do formato que você selecionar. O campo Cadeia de formatos confirma a sua seleção. Outra opção é especificar um formato digitando-o no campo Cadeia de formatos.
  9. Especifique o formato de saída na área Formato de Saída da janela:
    1. Selecione uma categoria para os dados da coluna de saída a partir da lista Categoria.
    2. Selecione um formato de data, hora ou registro de tempo a partir da lista Formato. A lista Exemplo mostra um exemplo do formato que você selecionar. O campo Cadeia de formatos confirma a sua seleção. Outra opção é especificar um formato digitando-o no campo Cadeia de formatos.
  10. Clique em OK.

    A janela Argumentos da Função - FormatDate se fecha e a expressão é exibida na janela do Construtor de Expressões.


[ Início da Página | Página Anterior | Próxima Página | Índice | Índice Remissivo ]