I denne øvelse skal du definere, hvordan datavarehuscentret skal flytte og transformere data til datavarehusets format. Du skal først definere en proces, der består af en række trin i transformerings- og flytningsprocessen. Derefter skal du angive de kildetabeller, der skal transformeres til varehuset. Endelig skal du definere datatransformeringstrin, som gør brug af to forskellige transformeringsmetoder:
Du skal med andre ord definere processen Markedsøvelse, der udfører følgende behandlinger:
Slutresultatet er måltabellen LOOKUP_MARKET.
I denne øvelse skal du definere procesobjektet til processen Markedsøvelse.
Sådan defineres procesobjektet:
Notesbogen Definér proces åbnes.
Markedsøvelse
Navnet kan bestå af op til 80 tegn. Der skelnes mellem store og små bogstaver. Det første tegn i navnet skal være et bogstav eller et tal. Du kan ikke benytte & som første tegn. Feltet skal udfyldes.
Proces til oprettelse af tabellen LOOKUP_MARKET
Når processen føjes til sikkerhedsgruppen, får brugerne i gruppen, i dette tilfælde dig selv, tilladelse til at åbne objekter og føje dem til processen.
Varehusgruppe til øvelse flyttes til oversigten Valgte sikkerhedsgrupper.
Notesbogen Definér proces lukkes.
I denne øvelse skal du åbne processen, så du grafisk kan definere processens datastrøm i næste øvelse.
Sådan åbnes processen Markedsøvelse:
Hvis du vil definere datastrømmen, skal du tilføje hver kilde, som trinene transformerer, og de måltabeller, transformeringerne opretter.
I processen Markedsøvelse skal du indlæse filen Demographics i måldatabasen. Du skal derfor føje kildefilen og måltabellen DEMOGRAPHICS_TARGET for trinet til processen. Kildefilen Demographics er en del af varehuskilden Filkilde til øvelse, som du har defineret i Øvelse 6, Definér varehuskilder. Måltabellen DEMOGRAPHICS_TARGET er en del af varehusmålet Øvelsesmål, som du har defineret i Øvelse 7, Definér varehusmål.
Sådan tilføjes filen Demographics:
Klik det sted på lærredet, hvor tabellen skal placeres. Vinduet Tilføj data åbnes.
Der vises en oversigt over varehuskilder, som er defineret i varehuset.
I træstrukturen vises X:\sqllib\samples\db2sampl\dwc\demographics.txt, hvor X er det drev, eksemplet er installeret på.
Sådan tilføjes måltabellen DEMOGRAPHICS_TARGET:
Der vises en oversigt over de varehusmål, som er defineret i varehuset.
Måltabellen DEMOGRAPHICS_TARGET vises i oversigten.
I næste del af øvelsen skal du tilføje kildetabellen GEOGRAPHIES. Når du definerer et trin, der vælger data fra tabellen GEOGRAPHIES, kan du angive, at datavarehuscentret skal oprette en måltabel automatisk, så du ikke selv behøver at tilføje en måltabel.
Sådan tilføjes kildetabellen GEOGRAPHIES:
Den fil og de tabeller, du har valgt, vises i vinduet Procesmodel.
Det sidste trin bruger tabellen Demographics og tabellen Geographies som kilder, så du behøver ikke at angive kilder til trinet. Du kan angive, at datavarehuscentret skal oprette måltabellen LOOKUP_MARKET automatisk, så du ikke behøver at angive en måltabel til trinet.
Du skal nu tilføje de trin, som definerer, hvordan kildedataene skal transformeres til måldata. Du skal definere tre trin:
I denne øvelse skal du definere trinet Indlæs demografiske data:
Hver programikon svarer til en programgruppe, som er en gruppe af relaterede programmer.
Programmerne i en programgruppe vises ud for programikonen.
Der vises en ikon for trinet i vinduet.
Notesbogen Trin åbnes.
Indlæs demografiske data
Indlæser demografiske data til varehuset.
Notesbogen Indstillinger for trin lukkes.
Du skal bruge ikonen Dataforbindelse til at definere datastrømmen fra kildefilen via transformering af et trin til måltabellen.
Datavarehuscentret viser en streg mellem filen og trinet.
Dette angiver, at kildefilen Demographics indeholder kildedataene til trinet.
Dette angiver, at måltabellen indeholder måldataene fra trinet.
Notesbogen Trin åbnes.
Godkend resten af standardværdierne på skillebladet.
Du kan springe siden Kolonneforbindelser over, da indlæsningsprogrammet ikke bruger kolonneforbindelser til at oprette måltabellen. Programmet opretter måltabellen ud fra kildefilen.
Der er flere oplysninger om værdierne på skillebladet under Indlæs data i tabel i onlinehjælpen.
Notesbogen Trin lukkes.
I denne øvelse skal du definere trinet Vælg geografiske data:
Der vises en ikon for trinet i vinduet.
Notesbogen Trin åbnes.
Vælg geografiske data
Udvælger geografiske data fra varehuskilden
Notesbogen Trin lukkes.
Datavarehuscentret viser en streg, som angiver, at kildetabellen Geographies indeholder kildedataene til trinet.
Da du skal angive, at datavarehuscentret skal oprette måltabellen, behøver du ikke at oprette en sammenkædning til en måltabel i dette trin.
Notesbogen Trin åbnes.
SQL-assistent åbnes.
SQL-assistent lukkes. Den SQL-sætning, du har bygget, vises på
skillebladet SQL-sætning.
Datavarehuscentret returnerer eksempelresultater fra SELECT-sætningen. Resultaterne skal være de samme som de resultater, du har fået i Øvelse 3, Søg i kildedata, da du søgte i eksempeldataene i kildetabellen Geographies.
Et hak i afkrydsningsfeltet angiver, at datavarehuscentret skal oprette måltabellen ud fra de værdier, der er angivet på skillebladet Kolonneforbindelser.
Varehusmålet er den database eller det filsystem, hvor måltabellen skal oprettes.
Godkend resten af standardværdierne på skillebladet. Der er flere oplysninger om værdierne på skillebladet i onlinehjælpen.
Notesbogen Trin lukkes. Datavarehuscentret opretter en måltabel med navnet "Select_Geog_T". Måltabellens navn står i anførselstegn, fordi det består af både store og små bogstaver.
Notesbogen Tabel åbnes.
GEOGRAPHIES_TARGET
Automatisk genereret måltabel til trinet Vælg geografiske data.
Geografisk måltabel
Sådan defineres trinet Sammenkæd markedsdata:
Der vises en ikon for trinet i vinduet.
Notesbogen Trin åbnes.
Sammenkæd markedsdata
Sammenkæder tabellen Geographies med tabellen Demographics
Notesbogen Trin lukkes.
Datavarehuscentret viser en streg, som angiver, at kildetabellen Geographies indeholder kildedataene til trinet.
Da du skal angive, at datavarehuscentret skal oprette måltabellen, behøver du ikke at oprette en sammenkædning til en måltabel i dette trin.
Notesbogen Trin åbnes.
SQL-assistent åbnes.
Kolonnen DEMOGRAPHICS_TARGET.STATE flyttes til oversigten Tilgængelige kolonner.
Kolonnen DEMOGRAPHICS_TARGET.CITY flyttes til oversigten Tilgængelige kolonner.
Du behøver ikke kolonnerne DEMOGRAPHICS_TARGET.STATE og DEMOGRAPHICS_TARGET.CITY, fordi de allerede er defineret i tabellen GEOGRAPHIES_TARGET table. Du skal sammenkæde alle tabellerne vha. kolonnen CITY, som er entydig, i begge tabeller.
Vinduet Byg udtryk åbnes.
case when POPULATION < 9000000 then 1 when POPULATION < 15000000 then 2 Else 3 end
Der føjes en ny kolonne til oversigten Valgte kolonner.
SIZE_ID
SQL-assistent viser en streg mellem CITY-kolonnerne for at angive, at tabellerne er sammenkædet via den kolonne.
SQL-assistent lukkes.
Et hak i afkrydsningsfeltet angiver, at datavarehuscentret skal oprette måltabellen ud fra de værdier, der er angivet på skillebladene SQL-sætning og Kolonneforbindelser.
Godkend resten af standardværdierne på skillebladet. Der er flere oplysninger om værdierne på skillebladet i onlinehjælpen.
Notesbogen Trin lukkes.
Notesbogen Tabel åbnes.
LOOKUP_MARKET
Markedsdimensionsdata
Denne tabel er en af de dimensionstabeller, der skal inkluderes i et stjerneskema i Øvelse 16, Opret et stjerneskema i datavarehuscentret.
Du har defineret dimensionstabellen LOOKUP_MARKET i processen Markedsøvelse, som indeholder tre trin:
Kilderne og målene for hvert af trinene er:
Trin | Kilder | Mål |
---|---|---|
Indlæs demografiske data | Filen Demographics | Måltabellen Demographics |
Vælg geografiske data | Tabellen Geographies | Måltabellen Geographies |
Sammenkæd markedsdata | Måltabellen Demographics og måltabellen Geographies | Tabellen LOOKUP_MARKET |
Til øvelsen har du tilføjet dataforbindelser for hvert trin, da du definerede egenskaberne for trinene. Du kan også udføre opgaven ved at tilføje alle trinene i processen på én gang, sammenkæde trinene med deres kilder og mål og derefter definere egenskaberne for hvert enkelt trin. Datavarehuscentret tildeler standardnavne til trinene, som du kan ændre i notesbogen Trin.
Tabellen LOOKUP_MARKET, som du har oprettet i forrige afsnit, er en af dimensionstabellerne i eksemplet i Eksempelproblemet i øvelserne. Dette afsnit beskriver de trin, der skal udføres for at opbygge resten af dimensionstabellerne og faktatabellen til stjerneskemaet.
Afsnittet er valgfrit, men hvis du ikke udfører trinene i afsnittet, kan du ikke udføre følgende øvelser:
Hvis du vil springe afsnittet over, skal du gå videre til Øvelse 9, Test varehustrin.
Hver gang du definerer en tabel, skal du definere en ny proces til tabellen. I stedet for at definere dit eget trin til processen skal du kopiere det trin, der er defineret i eksemplet. Definitionen af trinet findes i det datavarehuscenter, som du bruger. Når du kopierer trinet, kopierer datavarehuscentret de kilder, som trinet bruger, og genererer en måltabel.
Sådan defineres produktdimensionstabellen:
Vinduet Procesmodel åbnes.
Vinduet Kopiér trin åbnes.
Vælg øvelsesprodukt
Øvelsesprodukt
Trinet og dets kilder kopieres til processen Øvelsesprodukt. Datavarehuscentret opretter den tilsvarende måltabel.
Gentag denne fremgangsmåde for resten af dimensionstabellerne og
faktatabellen.
Dimension | Øvelses- proces | Eksempel- tid | Eksempel- trin | Øvelses- trin | Varehus- mål | Kildetabeller | Måltabel | Nyt navn på måltabel |
---|---|---|---|---|---|---|---|---|
Tidspunkt | Tidspunkt for øvelse | Målingstidspunkt | Vælg tidspunkt | Vælg tidspunkt for øvelse | Øvelsesmål | TIME |
TARGET_ TIME |
LOOKUP_ TIME |
Scenarie | Øvelsesscenarie | Eksempel- scenarie | Vælg scenarie | Vælg øvelses- scenarie | Øvelsesmål | SCENARIO |
TARGET _SCENARIO |
LOOKUP_ SCENARIO |
Faktatabel | Faktatabel til øvelse | Eksempel- faktatabel | Faktatabel- sammen- kædning | Sammen- kædning af faktatabel til øvelse | Øvelsesmål |
SALG, LAGER og PRODUKT _OMKOSTN. |
TARGET_ FACT_ TABLE |
FACT_ TABLE |
Du har nu defineret fem processer med tilhørende kilder, mål og trin i datavarehuscentret: