操作可能データ (業務の日常トランザクションを実行するデータ) を含むシステムには、 業務分析に便利な情報が含まれています。 たとえば、 分析者はどの製品がどの地域で、年のどの時期に売れたかに関する情報を使用して、 例外を探したり、将来の売上を予測したりできます。
しかし、 分析者が操作可能データに直接アクセスするには、いくつかの問題があります。
データウェアハウジングは、これらの問題を解決します。 データウェアハウジング では、 情報データ (操作可能データから抜き出され、 エンド・ユーザーの意思決定用に変換されたデータ) のストアを作成できます。 たとえば、 データウェアハウジング・ツールでは、すべての販売データを操作可能データベースからコピーして、 データの要約を計算し、 操作可能データとは別のデータベースにあるターゲットに要約データを書き込むことができます。 エンド・ユーザーは、 操作可能データベースに影響を与えることなくこのデータベース (ウェアハウス) に照会できます。
以降のセクションでは、 データウェアハウスの作成と保守に使用するオブジェクト (サブジェクト・エリア、 ウェアハウス・ソース、ウェアハウス・ターゲット、 エージェント、エージェント・サイト、ステップ、およびプロセス) について説明します。
サブジェクト・エリア は、 業務の論理領域と関連するプロセスを識別し、グループ分けします。 たとえば、 マーケティングおよび売上データのウェアハウスを作成している場合は、 「売上 (Sales)」サブジェクト・エリアと「マーケティング (Marketing)」サブジェクト・エリアを定義できます。 次に、「売上 (Sales)」サブジェクト・エリアの下に、販売に関連するプロセスを追加できます。 同様に、 「マーケティング (Marketing)」サブジェクト・エリアの下に、マーケティング・データと関連する定義を追加できます。
ウェアハウス・ソース は、 ウェアハウスにデータを提供する表とファイルを識別します。 データウェアハウスセンターはウェアハウス・ソースの指定を使用して、 データのアクセスと選択を行います。 ソースには、ウェアハウスに接続可能なほとんどすべての リレーショナル・ソースまたは非リレーショナル・ソース (表、ビュー、またはファイル) を使用できます。
ウェアハウス・ターゲット は、 エンド・ユーザーが使用できるように変換されたデータを含むデータベース表またはファイルです。 ウェアハウス・ソースのように、 ウェアハウス・ターゲットもデータをデータウェアハウスセンター・ステップに提供できます。
データウェアハウスセンターのエージェント は、 データ・ソースとターゲット・ウェアハウスの間のデータの流れを管理します。 エージェントは、Windows NT、AIX、OS/2、OS/390、OS/400、および SUN Solaris オペレーティング・システムで利用できます。 エージェントはオープン・データベース・コネクティビィティー (ODBC) ドライバー または DB2 CLI を使用して、 さまざまなデータベースと通信します。
複数のエージェントが、 ソース・ウェアハウスとターゲット・ウェアハウス間のデータの転送を処理できます。 使用するエージェントの数は、 既存の接続構成と、 ウェアハウスで移動することを計画しているデータのボリュームによって異なります。 同じエージェントを必要とする複数のプロセスを同時に実行する場合は、 そのエージェントの追加インスタンスを生成できます。
エージェントには、ローカル・エージェントとリモート・エージェントがあります。 ローカル・ウェアハウス・エージェント は、 ウェアハウス・サーバーと同じマシンにインストールされているエージェントです。 リモート・ウェアハウス・エージェント は、 ウェアハウス・サーバーに接続できる別のマシンにインストールされているエージェントです。
エージェント・サイト は、 エージェント・ソフトウェアがインストールされているワークステーションの論理名です。 エージェント・サイト名は、TCP/IP ホスト名と同じではありません。 単一の物理マシンが持つことのできる TCP/IP ホスト名は 1 つだけです。 しかし、エージェント・サイトは単一のマシンで複数定義することができます。 各エージェント・サイトは論理名によって識別されます。
Default VW AgentSite という名前のデフォルト・エージェント・サイト は、 ウェアハウス制御データベースの初期化時にデータウェアハウスセンターが定義する、 Windows NT 上のローカル・エージェントです。
ステップ は、 データウェアハウスセンターにある論理エンティティーであり、 次のものを定義します。
ステップは、SQL ステートメントを使用したりプログラムを呼び出したりして、 データの移動や変換を行います。 ステップを実行すると、 ウェアハウス・ソースとウェアハウス・ターゲット間でのデータの転送と、 データの変換が行われます。
プロセス には、 変換および移動タスクを実行する一連のステップが含まれます。 一般に、プロセスは、 1 つまたは複数のウェアハウス・ソース (データベース表またはファイル) からデータを抜き出すことにより、 ウェアハウス・データベースにあるウェアハウス・ターゲットにデータを入れます。 ただし、 ウェアハウス・ソースまたはウェアハウス・ターゲットを指定せずにプログラムを立ち上げるプロセスを定義することもできます。
必要に応じてにステップを実行するか、または 設定時刻にステップを実行するようにスケジュールすることができます。 1 回だけステップを実行するようにスケジュールするか、 または毎週金曜日などのように繰り返し実行するようにスケジュールすることができます。 また、ステップを順番に実行するようにスケジュールし、 1 つのステップの実行が終了したら、次のステップの実行が開始されるようにすることもできます。 ステップは、他のステップの完了時 (成功時または失敗時) に実行されるようにスケジュールできます。 プロセスをスケジュールする場合、 スケジュールした時間にプロセスの最初のステップが実行されます。
ステップまたはプロセスが実行されると、次の方法でデータが保管されます。
データウェアハウスセンターに次のタスクを実行させるとします。
個々のステップを含むプロセスを作成することができます。 データベースからのデータの抽出、 正しい形式への変換などのように、ステップごとに別々のタスクが実行されます。 次に、別のステップを使用して、変換されたデータを含むターゲット表にデータを入れることができます。
以降のセクションでは、 データウェアハウスセンターで使用できるさまざまなタイプのステップについて説明します。 ステップについての詳細は、データウェアハウスセンター 管理の手引き を参照してください。
SQL ステップは、SQL SELECT ステートメントを使用して ウェアハウス・ソースからデータを抽出し、 そのデータをウェアハウス・ターゲット表に挿入するための INSERT ステートメントを生成します。
プログラム・ステップには、複数のタイプがあります。 DB2 (AS/400 版) プログラム、DB2 (OS/390 版) プログラム、 DB2 UDB プログラム、Visual Warehouse 5.2 DB2 プログラム、 OLAP サーバー・プログラム、ファイル・プログラム、および複製です。 これらのステップは、事前定義されたプログラムとユーティリティーを実行します。
トランスフォーマー・ステップは、ストアード・プロシージャーとユーザー定義関数であり、 データを変換するために使用できる統計またはウェアハウス・トランスフォーマーを指定します。 トランスフォーマーを使用すると、 データのクリーニング、逆転、およびピボットを行ったり、 基本キーと期間表を生成したり、 さまざまな統計を計算したりすることができます。
トランスフォーマー・ステップでは、 統計またはウェアハウス・トランスフォーマーの 1 つを指定します。 このプロセスを実行すると、 トランスフォーマー・ステップは 1 つまたは複数のウェアハウス・ターゲットにデータを書き込みます。
ユーザー定義プログラム・ステップ は、 データウェアハウスセンターにある論理エンティティーであり、 データウェアハウスセンターが開始するアプリケーションを表します。 ウェアハウス・エージェントは、次のようにユーザー定義プログラム・ステップを開始できます。
たとえば、次のプロセスを実行するユーザー定義プログラムを作成できます。