Tutoriel Business Intelligence
Cette section présente le concept d'entreposage de
données (en anglais, "data warehousing") et les différentes tâches liées à
l'entreposage de données couvertes dans ce tutoriel.
Les systèmes qui contiennent des données opérationnelles,
c'est-à-dire des données qui sont utilisées pour les transactions
quotidiennes dans votre entreprise, contiennent par là même des informations
qui sont utiles aux analystes de gestion. Par exemple, ces derniers
peuvent utiliser les informations relatives aux produits vendus dans les
différentes régions aux différentes périodes de l'année pour rechercher
d'éventuelles anomalies ou pour estimer les volumes de vente
futurs. Toutefois, plusieurs problèmes peuvent se poser si les
analystes accèdent directement aux données opérationnelles :
- Ils peuvent ne pas posséder les connaissances nécessaires pour interroger
la base de données opérationnelle. Par exemple, l'interrogation
des bases de données IMS requiert un programme d'application qui utilise
un langage de manipulation de données spécifique. En général, les
programmeurs qui possèdent les connaissances requises pour interroger la base
de données opérationnelle sont occupés à plein temps par la maintenance de
cette base et de ses applications.
- Les performances sont un élément essentiel pour de nombreuses bases de
données opérationnelles, telles que celles d'une banque, par
exemple. Dans ce cas, le système ne peut pas gérer les requêtes
spécifiques des utilisateurs.
- Les données opérationnelles ne sont généralement pas stockées dans le
format le plus adapté à leur exploitation par les analystes de gestion.
Par exemple, des récapitulatifs des ventes par produit, région et saison sont
beaucoup plus utiles aux analystes que des données brutes.
L'entreposage de données permet de résoudre ces
problèmes. Avec cette technique, vous créez des magasins de
données informationnelles, c'est-à-dire de données qui ont été
extraites des données opérationnelles et transformées en vue de faciliter la
prise de décision par l'utilisateur final. Par exemple, un outil
d'entreposage de données peut créer une copie des données des ventes
stockées dans la base de données opérationnelle, effectuer des calculs
récapitulatifs sur ces données, puis écrire les résultats dans une base de
données distincte. Les utilisateurs peuvent alors interroger cette base
de données (l'entrepôt) sans perturber le fonctionnement de la
base de données opérationnelle.
DB2 Universal Database inclut Data Warehouse Center, un composant DB2
qui automatise la gestion des entrepôts de données. Data Warehouse
Center vous permet de définir quelles données doivent être stockées dans un
entrepôt. Vous pouvez ensuite l'utiliser pour planifier
automatiquement la régénération des données de cet entrepôt.
Le présent tutoriel explique comment effectuer les tâches les plus
courantes liées à la création d'un entrepôt.
Dans cette partie du tutoriel, vous apprendrez à accomplir les tâches
suivantes :
- définir un domaine pour identifier et regrouper les processus
que vous créerez au cours de ce tutoriel ;
- explorer les données source (c'est-à-dire les données
opérationnelles) et définir les sources d'entrepôt de données. Les
sources d'un entrepôt identifient les données source à inclure
dans cet entrepôt ;
- créer une base de données qui servira d'entrepôt et définir les
cibles d'entrepôt, qui identifient les données cible à inclure
dans cet entrepôt ;
- indiquer comment les données source doivent être déplacées et converties
au format approprié pour la base de données de l'entrepôt. Vous
définirez un processus, c'est-à-dire la séquence des étapes de
déplacement et de transformation (conversion) requises pour créer une table
cible dans l'entrepôt à partir d'un ou plusieurs fichiers, tables ou
vues source. Vous diviserez ensuite ce processus en plusieurs
étapes, représentant chacune une opération du processus de
déplacement et de transformation. Puis vous testerez ces étapes et
planifierez leur exécution automatique ;
- administrer l'entrepôt en définissant la sécurité et en contrôlant
l'utilisation de la base de données ;
- créer un catalogue d'informations relatif aux données de
l'entrepôt, si vous avez installé le produit DB2 Warehouse
Manager. Un catalogue d'informations est une base de
données qui contient des métadonnées métier qui aident les utilisateurs à
identifier et à localiser les données et les informations qui sont à leur
disposition dans l'entreprise. Les utilisateurs finals de
l'entrepôt peuvent consulter ce catalogue pour déterminer quelles tables
interroger ;
- définir un modèle de schéma en étoile pour les données de
l'entrepôt. Un schéma en étoile est un schéma de
conception spécialisé qui utilise plusieurs tables de dimension,
qui représentent les différents aspects de l'activité de
l'entreprise, et une tables des faits, qui contient les
informations factuelles relatives à l'entreprise. Par exemple, si
vous produisez des boissons non alcoolisées, vos tables de dimension peuvent
inclure les tables Products, Market et Time. La table des faits, quant
à elle, peut contenir des informations transactionnelles relatives aux
produits commandés dans chaque région pendant chaque saison ;
- joindre les tables de dimension et la table des faits pour combiner les
informations détaillées contenues dans les premières et les informations
relatives aux commandes contenues dans cette dernière. Par exemple,
vous pouvez créer une jointure entre la dimension Products et la table des
faits pour ajouter aux informations relatives aux commandes des informations
concernant la manière dont chaque produit a été conditionné.
[ Début de page | Page précédente | Page suivante | Table des matières ]