Um serviço de movimentação de dados ativa um aplicativo para mover dados de
um banco de dados de origem para um banco de dados de destino. Os bancos de dados de origem e de destino podem
ser homogêneos ou heterogêneos: ou seja, podem residir em um único sistema ou ser distribuídos
em vários sistemas. Com exceção da movimentação de dados, um serviço pode transformar
dados e fornecer funcionalidade do ciclo de vida de dados básicos, conforme
requerido pelo aplicativo.
Serviços de movimentação de dados são implementados por cinco componentes principais:
- Componente Capture (origem)
- Componente Apply (destino)
- Componente ETL (Extract, Transform, Load)
- Componente Source Life Cycle
- Componente Target Life Cycle
Os componentes Capture e Apply trabalham em conjunto para mover os dados do
banco de dados de origem para o banco de dados de destino. O componente ETL desempenha qualquer transformação de dados
necessária, caso as estruturas de dados no banco de dados de origem sejam diferentes
das estruturas de dados no banco de dados de destino. O
seguinte diagrama ilustra o fluxo do processo em um serviço de movimentação de dados:
O fluxo do serviço de movimentação de dados segue estas etapas:
- Os dados nas tabelas de origem são armazenados e freqüentemente atualizados, por exemplo,
pelo Monitor Server. O componente Capture registra, nas tabelas de trabalho, quaisquer
alterações de dados feitas nas tabelas de origem.
- Nos intervalos predefinidos, as alterações são identificadas pelo componente Apply
e registradas nas tabelas de trabalho.
- Após as alterações serem registradas com êxito, o componente ETL é chamado.
- Utilizando os dados armazenados nas tabelas de trabalho do Apply e as regras
predefinidas, o componente ETL desempenha as transformações necessárias. Os dados que foram
transformados com êxito são gravados nas tabelas de destino. Qualquer dado incompleto
ou errado é mantido em outras tabelas do conjunto de trabalho para processamento posterior.
- Na conclusão do processamento de ETL, o componente Target Life Cycle
é ativado.
- Ao longo do tempo, grandes quantidades de dados podem acumular nas tabelas de trabalho do Apply.
Os dados nessas tabelas que foram processados com êxito pelo componente ETL
são removidos pelo componente Target Life Cycle.
- Assim que os dados são copiados com êxito para o banco de dados de destino,
eles não são mais necessários e podem ser removidos das tabelas de trabalho do Capture. O componente Capture
remove periodicamente as tabelas de trabalho para reduzir as contingências de recursos.
- A remoção de dados das tabelas de trabalho Capture aciona a chamada do
componente Source Life Cycle.
- Os dados que foram processados com êxito, marcados como prontos para
exclusão e que passaram pela Política de Retenção do Source Life Cycle são removidos
do banco de dados de origem.
Os componentes Capture e Source Life Cycle geralmente residem
no sistema de origem, enquanto os componentes Apply, ETL e Target Life Cycle
residem no sistema de destino, como mostrado na figura a seguir:
No serviço de movimentação de dados, várias instâncias dos componentes podem ser
utilizadas dependendo das estruturas de dados utilizadas nos bancos de dados de origem e de destino.
O número de instâncias de componentes está diretamente relacionado ao número de grupos
de medidas de negócios e ao número de tabelas de origem e destino em um
modelo de medidas de negócios. Cada instância é identificada
de maneira exclusiva. As seguintes regras são aplicadas ao
WebSphere Business Monitor:
- Uma instância do componente Capture é designada a um projeto do modelo de medidas de negócios e
captura as alterações de todas as tabelas de origem pertencentes a esse projeto do modelo de medidas de negócios.
- Uma instância do componente Apply é designada a um projeto do modelo de medidas de negócios e
registra as alterações que precisam ser aplicadas às tabelas de destino que pertencem
a esse projeto do modelo de medidas de negócios.
- Uma instância de componente ETL é designada para uma tabela de destino.
- Uma instância do componente Source Life Cycle é designada a uma tabela de origem.
- Uma instância do componente Target Life Cycle é designada a uma tabela
de trabalho do Apply.
Uma instância de componente pode ser, por exemplo, um programa executável, um procedimento armazenado
do banco de dados ou um acionador do banco de dados.
Duas instâncias dos serviços de movimentação de dados são utilizadas no
WebSphere Business Monitor:
- Estado no Tempo de Execução do Serviço de Movimentação de Dados
- Serviço de movimentação de dados de Tempo de Execução para Histórico.
O serviço de movimentação de dados de Estado para Tempo de Execução processa os dados que foram
armazenados pelo Monitor Server no banco de dados de Estado e move esses dados para o
banco de dados de Tempo de Execução no qual eles podem ser acessados pelo painel. O serviço de movimentação
de dados de Tempo de Execução para Histórico move dados do banco de dados de Tempo de Execução para
o banco de dados de Histórico. O seguinte diagrama ilustra essa movimentação:
As informações a seguir descrevem as configurações padrão para esses serviços,
como configurar, iniciar e parar e monitorá-los.