Centro de Data Warehouse Guia de Administração

Data warehouse no DB2 Universal Database

As seções a seguir descrevem os objetos que serão usados para criar e manter seu data warehouse.

Áreas de Assunto

Uma área de assunto identifica e agrupa os processos relacionados a uma área lógica do negócio. Por exemplo, se você estiver gerando um warehouse com dados de marketing e vendas, definirá uma área de assunto de Vendas e um de Marketing. Em seguida, inclua os processos relacionados a vendas na área de assunto Vendas. Da mesma forma, inclua as definições relativas aos dados de marketing sob a área de assunto de Marketing.

Origens do warehouse

As origens do warehouse identificam as tabelas e arquivos que irão fornecer dados ao warehouse. O Centro de Data Warehouse usa as especificações nas origens do warehouse para acessar os dados. As origens podem ser qualquer origem relacional ou não-relacional (tabela,view ou arquivo) que tenha conectividade com a rede.

Destinos do warehouse

Os destinos do warehouse são tabelas ou arquivos do banco de dados que contêm dados transformados. Como numa origem do warehouse, os usuários podem usar os destinos para fornecer dados a outros destinos do warehouse. Um warehouse central pode fornecer dados para servidores departamentais ou uma tabela de fatos principal pode fornecer dados às tabelas de resumo.

Agentes do warehouse e locais do agente

Os agentes do warehouse gerenciam o fluxo de dados entre as origens de dados e os warehouses de destino. Os agentes do warehouse estão disponíveis nos sistemas operacionais AIX(R), AS/400(R), OS/2(R), OS/390(R) e Windows NT, e para o ambiente operacional do Solaris. Os agentes usam controladores ODBC (Open Database Connectivity) (ODBC) ou a CLI do DB2 para comunicação com bancos de dados diferentes.

Vários agentes podem manipular a transferência de dados entre origens e destinos de warehouses. O número de agentes que você utilizar dependerá da configuração de conectividade existente e do volume de dados que você pretende mover para o warehouse. Podem ser geradas instâncias adicionais de um agente se vários processos que exigem o mesmo agente estiverem em execução simultaneamente.

Os agentes podem ser locais ou remotos. Um agente local do warehouse é um agente que está instalado na mesma estação de trabalho que o servidor do warehouse. Um agente remoto do warehouse indica que está instalado em outra estação de trabalho que tem conectividade ao servidor do warehouse.

Um local do agente é um nome lógico para uma estação de trabalho em que o software do agente está instalado. O nome do local do agente não é o mesmo que o nome do host TCP/IP. Uma única estação de trabalho pode ter somente um nome do host TCP/IP. No entanto, é possível definir vários locais do agente numa única estação de trabalho. Um nome lógico identifica cada local do agente.

O local do agente padrão, denominado Local do Agente Padrão DWC, é um agente local no Windows NT que o Centro de Data Warehouse define durante a inicialização do banco de dados de controle do warehouse.

Processos e etapas

Um processo contém uma série de etapas que executam uma transformação e um movimento dos dados para um uso específico do warehouse. Em geral, um processo move os dados de origem para o warehouse. Depois, os dados são agregados e resumidos para uso do warehouse. Um processo pode produzir uma única tabela plana ou um conjunto de tabelas de resumo. Um processo também pode executar algum tipo específico de transformação de dados.

Uma etapa é a definição de uma única operação dentro do warehouse. Através do uso das instruções SQL ou da chamada de programas, as etapas definem como os dados serão movidos e transformados. Ao executar uma etapa, pode ocorrer uma transferência de dados entre a origem do warehouse e o destino do warehouse, ou qualquer transformação desses dados.

Uma etapa é uma unidade lógica no Centro de Data Warehouse que define:

Supondo-se que você deseje que o Centro de Data Warehouse execute as seguintes tarefas:

  1. Extraia dados de bancos de dados diferentes.
  2. Converta os dados para um único formato.
  3. Grave os dados numa tabela num data warehouse.

Você criaria um processo que contém várias etapas. Cada etapa executa uma tarefa separada, como a extração dos dados de um banco de dados ou a conversão para o formato correto. Será necessário criar várias etapas para transformar e formatar completamente os dados e colocá-los na sua tabela final.

Quando uma etapa ou processo é executado, o destino pode ser afetado das seguintes formas:

Para obter mais informações, consulte o manual Definindo as opções de processamento.

Uma etapa pode ser executada conforme necessário ou pode ser programada para execução numa determinada hora. Pode ser executada somente numa hora ou pode ser programada para execução repetida, como toda sexta-feira. Você também pode programar etapas para execução em seqüência, para que quando uma etapa termine a execução, a próxima comece. As etapas podem ser programadas para execução após a conclusão de outra etapa, seja bem ela bem-sucedida ou não. Se você programar um processo, a primeira etapa será executada no horário programado.

As seções seguintes descrevem os diversos tipos de etapas que você encontrará no Centro de Data Warehouse. Para obter mais informações sobre etapas, consulte Capítulo 5, Definindo e executando processos e o auxílio online do Centro de Data Warehouse.

Etapas do SQL

Uma etapa do SQL usa uma instrução SQL SELECT para extrair dados de uma origem do warehouse e gera uma instrução INSERT para inserir os dados na tabela de destino do warehouse.

Etapas do programa

Há vários tipos de etapas do programa: programas DB2 para AS/400, programas DB2 para OS/390, programas DB2 para UDB, programas Visual Warehouse 5.2 DB2, programas do Servidor OLAP, programas de Arquivo e Replicação. Estas etapas executam programas e utilitários predefinidos.

Etapas do transformador

As etapas do transformador são procedimentos armazenados e funções definidas pelo usuário que especificam transformadores estatísticos ou do warehouse que podem ser usados para transformar dados. Eles servem para limpar, inverter e distribuir dados, para gerar chaves primárias e tabelas de período, e para calcular várias estatísticas.

Numa etapa do transformador, especifique um dos transformadores estatísticos ou do warehouse. Ao executar o processo, a etapa do transformador grava dados em um ou mais destinos do warehouse.

Etapas do programa definido pelo usuário

Uma etapa do programa definido pelo usuário é uma entidade lógica dentro do Centro de Data Warehouse que representa uma transformação específica do negócio que você deseja que o Centro de Data Warehouse inicie. Como cada negócio possui requisitos de transformação de dados exclusivos, as empresas podem optar por gravar suas próprias etapas do programa ou usar ferramentas como as fornecidas por ETI ou Vality.

Por exemplo, você pode gravar um programa definido pelo usuário que executará as seguintes funções:

  1. Exportará dados de uma tabela.
  2. Manipulará esses dados.
  3. Gravará os dados num recurso de saída temporário ou num destino do warehouse.


[ Início da Página | Página Anterior | Próxima Página | Índice | Índice Remissivo ]