Dans cette leçon, vous définirez comment Data Warehouse Center doit déplacer les données et les convertir au format approprié en vue de leur stockage dans l'entrepôt de données. Vous commencerez par définir un processus, c'est-à-dire une séries d'étapes de déplacement et de transformation. Puis vous indiquerez les tables source qui doivent être transformées en vue de l'intégration de leurs données à l'entrepôt. Enfin, vous définirez des étapes de transformation utilisant deux méthodes de transformation des données :
Plus précisément, vous définirez le processus Tutorial Market, qui effectuera le traitement suivant :
Cette opération aura pour résultat la table cible LOOKUP_MARKET.
Dans cet exercice, vous définirez l'objet processus du processus Tutorial Market.
Pour définir l'objet processus, procédez comme suit :
Le bloc-notes Définition d'un processus s'ouvre.
Tutorial Market
Un nom de processus peut comporter jusqu'à 80 caractères et une distinction est opérée entre majuscules et minuscules. Le premier caractère du nom doit être alphanumérique. En anglais, ce premier caractère ne peut être &. Cette zone est obligatoire.
Process to create the LOOKUP_MARKET table
L'ajout du processus à ce groupe de sécurité autorise les utilisateurs de ce groupe (en l'occurrence, vous) à ouvrir le processus et à y ajouter des objets.
Le groupe sélectionné est transféré dans la liste Groupes d'utilisateurs sélectionnés.
Le bloc-notes Définition d'un processus se ferme.
Dans cet exercice, vous ouvrirez le processus de manière à pouvoir ensuite, dans l'exercice suivant, y définir graphiquement le flot des données.
Pour ouvrir le processus Tutorial Market, procédez comme suit :
Pour définir le flot des données, vous devez ajouter chaque source qui sera transformée par les étapes ainsi que les tables cible résultant de cette transformation.
Dans le processus Tutorial Market, vous devez charger le fichier de données démographiques dans la base de données cible. Vous devez donc ajouter au processus le fichier source et la table cible DEMOGRAPHICS_TARGET qui seront utilisés dans l'étape de chargement. Le fichier source contenant les données démographiques fait partie de la source d'entrepôt Tutorial File Source, que vous avez définie au Chapitre 6, Définition des sources de l'entrepôt. La table cible DEMOGRAPHICS_TARGET fait partie de la cible d'entrepôt Tutorial Targets, que vous avez définie au Chapitre 7, Définition des cibles de l'entrepôt.
Pour ajouter le fichier de données démographiques, procédez comme suit :
Cliquez sur le canevas à l'emplacement où vous voulez placer la table. La fenêtre Ajout de données s'ouvre.
La liste des sources définies dans l'entrepôt apparaît.
Dans cette arborescence, vous devriez voir X:\sqllib\samples\db2sampl\dwc\demographics.txt, où X représente l'unité sur laquelle vous avez installé l'exemple.
Pour ajouter la table cible DEMOGRAPHICS_TARGET, procédez comme suit :
La liste des cibles définies dans l'entrepôt apparaît.
La table cible DEMOGRAPHICS_TARGET devrait figurer dans la liste.
Dans la suite de cet exercice, vous allez ajouter la table source GEOGRAPHIES. Lorsque vous définissez une étape qui sélectionne des données dans la table GEOGRAPHIES, vous pouvez demander que Data Warehouse Center génère automatiquement une table cible. Par conséquent, vous n'avez pas besoin d'ajouter cette table manuellement.
Pour ajouter la table source GEOGRAPHIES, procédez comme suit :
Ces derniers sont affichés dans la fenêtre Modèle de processus.
Comme la dernière étape utilisera les tables de données démographiques et géographiques en tant que sources, vous n'avez pas besoin de spécifier des sources pour cette étape. De même, comme vous pouvez demander que Data Warehouse Center génère automatiquement la table cible résultante LOOKUP_MARKET, vous n'avez pas besoin d'indiquer de table cible pour cette étape.
A présent, vous devez ajouter les étapes qui définissent comment les données source doivent être converties pour former les données cible. Vous devez définir les trois étapes suivantes :
Dans cet exercice, vous définirez l'étape Load Demographics Data.
Chaque icône de programme représente un groupe de programmes, c'est-à-dire un ensemble de programmes connexes.
Les programmes d'un groupe s'affichent en cascade à partir de l'icône de ce groupe.
L'icône correspondant à l'étape est ajoutée à la fenêtre.
Le bloc-notes Propriétés de l'étape s'ouvre.
Load Demographics Data
Loads demographics data into the warehouse.
Le bloc-notes Propriétés de l'étape se ferme.
Cette icône vous permet de définir le flot des données du fichier source à la table cible, en passant par l'étape de transformation.
Data Warehouse Center trace une ligne entre le fichier et l'étape.
Cette opération permet d'indiquer que le fichier source Demographics contient les données source de l'étape.
Cette opération permet d'indiquer que la table cible Demographics Table est destinée à contenir les données cible de l'étape.
Le bloc-notes Propriétés de l'étape s'ouvre.
Acceptez les autres valeurs par défaut de la page.
Vous pouvez ignorer la page Mappage de colonnes car le programme de chargement Load n'utilise pas le mappage de colonnes pour générer la table cible. Il la génère sur la base du fichier source.
Pour plus d'informations concernant ces valeurs, reportez-vous à la rubrique "Chargement de données dans une table" de l'aide en ligne.
Le bloc-notes Propriétés de l'étape se ferme.
Dans cet exercice, vous définirez l'étape Select Geographies Data.
L'icône correspondant à l'étape est ajoutée à la fenêtre.
Le bloc-notes Propriétés de l'étape s'ouvre.
Select Geographies Data
Selects Geographies data from the warehouse source
Le bloc-notes Propriétés de l'étape se ferme.
Data Warehouse Center trace une ligne pour indiquer que la table source Geographies contient les données source de l'étape.
Comme vous demanderez à Data Warehouse Center de générer la table cible, vous n'avez pas besoin d'effectuer de liaison à une table cible pour cette étape.
Le bloc-notes Propriétés de l'étape s'ouvre.
L'Assistant SQL s'ouvre.
L'Assistant SQL se ferme. L'instruction SQL que vous venez
de construire s'affiche sur la page Instruction SQL.
Data Warehouse Center renvoie un exemple de résultats pour votre instruction SELECT. Ces résultats doivent être identiques à ceux que vous avez obtenus au Chapitre 3, Visualisation des données source, lorsque vous avez affiché les données exemples de la table source Geographies.
Cette opération permet d'indiquer à Data Warehouse Center qu'il doit créer la table cible sur la base des valeurs indiqués sur la page Mappage de colonnes.
La cible d'entrepôt est la base de données ou le système de fichier dans lequel la table cible doit être créée.
Acceptez les autres valeurs par défaut de la page. Pour plus d'informations concernant ces valeurs, reportez-vous à l'aide en ligne.
Le bloc-notes Propriétés de l'étape se ferme. Data Warehouse Center génère une table cible appelée "Select_Geog_T". Le nom de cette table cible est entre guillemets car il comporte une combinaison de minuscules et de majuscules.
Le bloc-notes Définition d'une table cible d'entrepôt s'ouvre.
GEOGRAPHIES_TARGET
Autogenerated target table for the Select Geographies Data step
Geographies Target
Pour définir l'étape Join Market Data, procédez comme suit :
L'icône correspondant à l'étape est ajoutée à la fenêtre.
Le bloc-notes Propriétés de l'étape s'ouvre.
Join Market Data
Joins the Geographies table with the Demographics table
Le bloc-notes Propriétés de l'étape se ferme.
Data Warehouse Center trace deux lignes pour indiquer que les tables GEOGRAPHIES_TARGET et DEMOGRAPHICS_TARGET contiennent les données source de l'étape.
Comme vous demanderez à Data Warehouse Center de générer la table cible, vous n'avez pas besoin d'effectuer de liaison à une table cible pour cette étape.
Le bloc-notes Propriétés de l'étape s'ouvre.
L'Assistant SQL s'ouvre.
La colonne DEMOGRAPHICS_TARGET.STATE est transférée dans la liste Colonnes disponibles.
La colonne DEMOGRAPHICS_TARGET.CITY est transférée dans la liste Colonnes disponibles.
Vous n'avez pas besoin des colonnes DEMOGRAPHICS_TARGET.STATE and DEMOGRAPHICS_TARGET.CITY car elles sont déjà définies dans la table GEOGRAPHIES_TARGET. Vous joindrez les tables à l'aide de la colonne CITY, qui figure dans les deux tables et est unique.
La fenêtre Générateur d'expressions s'ouvre.
case when POPULATION < 9000000 then 1 when POPULATION < 15000000 then 2 Else 3 end
Une nouvelle colonne est ajoutée à la liste Colonnes sélectionnées.
SIZE_ID
L'Assistant SQL trace une ligne entre les colonnes CITY pour indiquer que les tables sont jointes sur cette colonne.
L'Assistant SQL se ferme.
Cette opération permet d'indiquer à Data Warehouse Center qu'il doit créer la table cible sur la base des valeurs indiquées sur les pages Instruction SQL et Mappage de colonnes.
Acceptez les autres valeurs par défaut de la page. Pour plus d'informations concernant ces valeurs, reportez-vous à l'aide en ligne.
Le bloc-notes Propriétés de l'étape se ferme.
Le bloc-notes Définition d'une table cible d'entrepôt s'ouvre.
LOOKUP_MARKET
Market dimension data
Cette table fait partie des tables de dimension que vous inclurez dans un schéma en étoile au Chapitre 16, Création d'un schéma en étoile à partir de Data Warehouse Center.
Dans cette leçon, vous avez défini la table de dimension LOOKUP_MARKET dans le processus Tutorial Market, qui contient les trois étapes suivantes :
Les sources et les cibles de chacune des étapes sont les
suivantes :
Etape | Sources | Cible |
---|---|---|
Load Demographics Data | fichier Demographics | table cible Demographics Target |
Select Geographies Data | table Geographies | table cible Geographies_Target |
Join Market Data | tables Geographies Target et Demographics Table | table Lookup_Market |
Pour les besoins de ce tutoriel, vous avez défini les liaisons de données de chaque étape en même temps que ses propriétés. Une autre manière de procéder consiste à créer d'abord toutes les étapes dans le processus, de les lier à leurs sources et à leurs cibles, puis de définir les propriétés de chaque étape. Data Warehouse Center attribue alors des noms par défaut aux étapes, que vous pouvez ensuite modifier à l'aide du bloc-notes Propriétés de l'étape.
La table que vous avez créée dans la section précédente, LOOKUP_MARKET, est l'une des tables de dimension de l'exemple présenté dans Présentation de l'étude de cas du tutoriel. La présente section décrit les étapes qui permettent de construire les autres tables de dimension et la table des faits du schéma en étoile.
Cette section est facultative mais, si vous n'effectuez pas les étapes qu'elle contient, vous ne pourrez pas effectuer les exercices des leçons suivantes :
Si vous ne voulez pas étudier cette section, passez au Chapitre 9, Test des étapes d'entrepôt.
Vous devez définir un nouveau processus pour chaque table que vous définissez. Toutefois, dans le cas présent, au lieu de définir votre propre étape pour le processus considéré, vous copierez l'étape définie dans l'exemple. La définition de l'étape figure dans votre Data Warehouse Center. Lorsque vous copiez l'étape, Data Warehouse Center copie les sources qu'elle utilise et génère une table cible.
Pour définir la table de dimension Product, procédez comme suit :
La fenêtre Modèle de processus s'ouvre.
La fenêtre Copie de l'étape s'ouvre.
Tutorial Select Product
Tutorial Product
L'étape et ses sources sont copiées dans le processus Tutorial Product. Data Warehouse Center génère la table cible correspondante.
Répétez cette procédure pour les autres tables de dimension et la table des
faits.
Dimension | Processus du tutoriel | Processus exemple | Etape exemple | Etape du tutoriel | Cible d'entrepôt | Tables source | Table cible | Nouveau nom de la table cible |
---|---|---|---|---|---|---|---|---|
Time | Tutorial Time | Sample Time | Select Time | Tutorial Select Time | Tutorial Targets | TIME |
TARGET_ TIME |
LOOKUP_ TIME |
Scenario | Tutorial Scenario | Sample Scenario | Select Scenario | Tutorial Select Scenario | Tutorial Targets | SCENARIO |
TARGET _SCENARIO |
LOOKUP_ SCENARIO |
Fact Table | Tutorial Fact Table | Sample Fact Table | Fact Table Join | Tutorial Fact Table Join | Tutorial Targets |
SALES, INVENTORY et PRODUCT_COSTS |
TARGET_FACT_ TABLE |
FACT_ TABLE |
Les cinq processus suivants, ainsi que les sources, cibles et étapes qui leur sont associées, sont désormais définis dans Data Warehouse Center :