Øvelser i Business Intelligence

Øvelse 8. Definér datatransformering og -flytning

I denne øvelse skal du definere, hvordan datavarehuscentret skal flytte og transformere data til datavarehusets format. Du skal først definere en proces, der består af en række trin i transformerings- og flytningsprocessen. Derefter skal du angive de kildetabeller, der skal transformeres til varehuset. Endelig skal du definere datatransformeringstrin, som gør brug af to forskellige transformeringsmetoder:

Du skal med andre ord definere processen Markedsøvelse, der udfører følgende behandlinger:

  1. Indlæsning af filen Demographics til varehusdatabasen.
  2. Udvælgelse af data i tabellen GEOGRAPHIES og oprettelse af en måltabel.
  3. Sammenkædning af dataene i tabellen Demographics og måltabellen GEOGRAPHIES.

Slutresultatet er måltabellen LOOKUP_MARKET.


Definér proces

I denne øvelse skal du definere procesobjektet til processen Markedsøvelse.

Sådan defineres procesobjektet:

  1. Udvid træstrukturen Emneområder i datavarehuscentret.
  2. Udvid emneområdet TBC-øvelser, som du har defineret i Øvelse 5, Definér emneområde.
  3. Klik med højre museknap på folderen Processer, og vælg Definér.

    Notesbogen Definér proces åbnes.

  4. Skriv processens navn i feltet Navn:
    Markedsøvelse
    

    Navnet kan bestå af op til 80 tegn. Der skelnes mellem store og små bogstaver. Det første tegn i navnet skal være et bogstav eller et tal. Du kan ikke benytte & som første tegn. Feltet skal udfyldes.

  5. Skriv dit navn i feltet Administrator som kontaktperson for procesdefinitionen.
  6. Beskriv processen i feltet Beskrivelse:
    Proces til oprettelse af tabellen LOOKUP_MARKET
    
  7. Vælg skillebladet Sikkerhed.
  8. Markér Varehusgruppe til øvelse, som du har defineret i Definér varehusgruppe, i oversigten Tilgængelige sikkerhedsgrupper.

    Når processen føjes til sikkerhedsgruppen, får brugerne i gruppen, i dette tilfælde dig selv, tilladelse til at åbne objekter og føje dem til processen.

  9. Vælg >.

    Varehusgruppe til øvelse flyttes til oversigten Valgte sikkerhedsgrupper.

  10. Vælg OK.

    Notesbogen Definér proces lukkes.


Åbn proces

I denne øvelse skal du åbne processen, så du grafisk kan definere processens datastrøm i næste øvelse.

Sådan åbnes processen Markedsøvelse:

  1. Klik med højre museknap på processen Markedsøvelse.
  2. Vælg Åbn.

Føj tabeller til proces

Hvis du vil definere datastrømmen, skal du tilføje hver kilde, som trinene transformerer, og de måltabeller, transformeringerne opretter.

I processen Markedsøvelse skal du indlæse filen Demographics i måldatabasen. Du skal derfor føje kildefilen og måltabellen DEMOGRAPHICS_TARGET for trinet til processen. Kildefilen Demographics er en del af varehuskilden Filkilde til øvelse, som du har defineret i Øvelse 6, Definér varehuskilder. Måltabellen DEMOGRAPHICS_TARGET er en del af varehusmålet Øvelsesmål, som du har defineret i Øvelse 7, Definér varehusmål.

Sådan tilføjes filen Demographics:

  1. Vælg ikonen Tilføj data:
    Figure alldata not displayed.

    Klik det sted på lærredet, hvor tabellen skal placeres. Vinduet Tilføj data åbnes.

  2. Udvid træstrukturen Varehuskilder i oversigten Tilgængelige kilde- og måltabeller.

    Der vises en oversigt over varehuskilder, som er defineret i varehuset.

  3. Udvid træstrukturen for varehuskilden Filkilde til øvelse.
  4. Udvid træstrukturen Filer.

    I træstrukturen vises X:\sqllib\samples\db2sampl\dwc\demographics.txt, hvor X er det drev, eksemplet er installeret på.

  5. Markér filen Demographics.
  6. Vælg > for at føje filen Demographics til oversigten Valgte kilde- og måltabeller.

Sådan tilføjes måltabellen DEMOGRAPHICS_TARGET:

  1. Udvid træstrukturen Varehusmål i oversigten Tilgængelige kilde- og måltabeller.

    Der vises en oversigt over de varehusmål, som er defineret i varehuset.

  2. Udvid træstrukturen Øvelsesmål.
  3. Udvid træstrukturen Tabeller.

    Måltabellen DEMOGRAPHICS_TARGET vises i oversigten.

  4. Markér måltabellen DEMOGRAPHICS_TARGET.
  5. Vælg > for at føje måltabellen DEMOGRAPHICS_TARGET til oversigten Valgte kilde- og måltabeller.

I næste del af øvelsen skal du tilføje kildetabellen GEOGRAPHIES. Når du definerer et trin, der vælger data fra tabellen GEOGRAPHIES, kan du angive, at datavarehuscentret skal oprette en måltabel automatisk, så du ikke selv behøver at tilføje en måltabel.

Sådan tilføjes kildetabellen GEOGRAPHIES:

  1. Markér tabellen GEOGRAPHIES i vinduet Tilføj data.
  2. Vælg > for at føje tabellen GEOGRAPHIES til oversigten Valgte kilde- og måltabeller.
  3. Vælg OK for at føje den valgte fil og de valgte tabeller til processen.

    Den fil og de tabeller, du har valgt, vises i vinduet Procesmodel.

Det sidste trin bruger tabellen Demographics og tabellen Geographies som kilder, så du behøver ikke at angive kilder til trinet. Du kan angive, at datavarehuscentret skal oprette måltabellen LOOKUP_MARKET automatisk, så du ikke behøver at angive en måltabel til trinet.


Føj trin til processen

Du skal nu tilføje de trin, som definerer, hvordan kildedataene skal transformeres til måldata. Du skal definere tre trin:

Indlæs demografiske data
Et DB2-programtrin, der indlæser data fra filen Demographics i en tabel i TBC-varehusdatabasen, som du oprettede i Øvelse 2, Opret varehusdatabase.

Vælg geografiske data
Et SQL-trin, der vælger kolonner i kildetabellen Geographies.

Sammenkæd markedsdata
Et SQL-trin, der sammenkæder tabellerne Geographies og Demographics og skriver den sammenkædede tabel til varehusdatabasen.

Definér trinet Indlæs demografiske data

I denne øvelse skal du definere trinet Indlæs demografiske data:

  1. Klik på ikonen DB2-programmer på paletten (værktøjslinien til venstre i vinduet). Det er den næstnederste ikon:
    Figure db2prog not displayed.

    Hver programikon svarer til en programgruppe, som er en gruppe af relaterede programmer.

  2. Vælg DB2 UDB --> Indlæs vha. LOAD.

    Programmerne i en programgruppe vises ud for programikonen.

  3. Klik det sted på lærredet (det tomme område til højre i vinduet), hvor trinet skal placeres.

    Der vises en ikon for trinet i vinduet.

  4. Klik på trinet med højre museknap.
  5. Klik på Indstillinger.

    Notesbogen Trin åbnes.

  6. Skriv navnet på trinet i feltet Navn:
    Indlæs demografiske data
    
  7. Skriv dit navn i feltet Administrator som trinets kontaktperson.
  8. Beskriv trinet i feltet Beskrivelse:
    Indlæser demografiske data til varehuset.
    
  9. Vælg OK.

    Notesbogen Indstillinger for trin lukkes.

  10. Vælg ikonen Opgavestrøm:
    Figure arrowcol not displayed.
  11. Vælg ikonen Dataforbindelse:
    Figure arrowgry not displayed.

    Du skal bruge ikonen Dataforbindelse til at definere datastrømmen fra kildefilen via transformering af et trin til måltabellen.

  12. Klik i midten af kildefilen Demographics, og flyt musen til trinet Indlæs demografiske data.

    Datavarehuscentret viser en streg mellem filen og trinet.

    Dette angiver, at kildefilen Demographics indeholder kildedataene til trinet.

  13. Klik i midten af trinet Indlæs demografiske data, og flyt musen til måltabellen med demografiske data.


    Sammenkædning mellem kildefilen Demographics og trinet Indlæs demografiske data

    Dette angiver, at måltabellen indeholder måldataene fra trinet.

  14. Klik på trinet med højre museknap.
  15. Klik på Indstillinger.

    Notesbogen Trin åbnes.

  16. Vælg skillebladet Parametre.
    Skillebladet Parametre i notesbogen Indstillinger for trin
  17. Vælg REPLACE i oversigten LOAD-tilstand.

    Godkend resten af standardværdierne på skillebladet.

    Du kan springe siden Kolonneforbindelser over, da indlæsningsprogrammet ikke bruger kolonneforbindelser til at oprette måltabellen. Programmet opretter måltabellen ud fra kildefilen.

  18. Godkend standardværdierne på siden Behandlingsvalg.
    Figure db2tu021 not displayed.

    Der er flere oplysninger om værdierne på skillebladet under Indlæs data i tabel i onlinehjælpen.

  19. Vælg OK.

    Notesbogen Trin lukkes.

Definér trinet Vælg geografiske data

I denne øvelse skal du definere trinet Vælg geografiske data:

  1. Vælg ikonen SQL på paletten:
    Figure sql not displayed.
  2. Klik det sted på lærredet, hvor trinet skal placeres.

    Der vises en ikon for trinet i vinduet.

  3. Klik på trinet med højre museknap.
  4. Klik på Indstillinger.

    Notesbogen Trin åbnes.

  5. Skriv navnet på trinet i feltet Navn:
    Vælg geografiske data
    
  6. Skriv dit navn i feltet Administrator som kontaktperson for trinet.
  7. Beskriv trinet i feltet Beskrivelse:
    Udvælger geografiske data fra varehuskilden
    
  8. Vælg OK.

    Notesbogen Trin lukkes.

  9. Vælg ikonen Opgavestrøm:
    Figure arrowcol not displayed.
  10. Vælg ikonen Dataforbindelse:
    Figure arrowgry not displayed.
  11. Klik i midten af kildetabellen Geographies, og flyt musen til midten af trinet Vælg geografiske data.

    Datavarehuscentret viser en streg, som angiver, at kildetabellen Geographies indeholder kildedataene til trinet.

    Da du skal angive, at datavarehuscentret skal oprette måltabellen, behøver du ikke at oprette en sammenkædning til en måltabel i dette trin.

  12. Klik med højre museknap på trinet Vælg geografiske data.
  13. Klik på Indstillinger.

    Notesbogen Trin åbnes.

  14. Vælg skillebladet SQL-sætning.
  15. Vælg Byg SQL for at bygge SQL vha. guiden SQL-assistent, der opretter SQL ud fra de valg, du foretager i guiden.

    SQL-assistent åbnes.

  16. Vælg skillebladet Tabeller.
  17. Kontrollér, at GEOGRAPHIES findes i oversigten.
    Figure db2tu016 not displayed.
  18. Vælg skillebladet Kolonner.
  19. Vælg >> for at føje alle kolonnerne i tabellen Geographies til oversigten Output.
    Skillebladet Kolonner i guiden Byg SQL
  20. Vælg skillebladet Gennemse for at få vist den SQL-sætning, du har bygget.
  21. Vælg OK.

    SQL-assistent lukkes. Den SQL-sætning, du har bygget, vises på skillebladet SQL-sætning.
    Sætningen GEOGRAPHIES SELECT på skillebladet SQL-sætning.

  22. Vælg Test for at afprøve den SQL-sætning, du har oprettet.

    Datavarehuscentret returnerer eksempelresultater fra SELECT-sætningen. Resultaterne skal være de samme som de resultater, du har fået i Øvelse 3, Søg i kildedata, da du søgte i eksempeldataene i kildetabellen Geographies.

  23. Vælg Luk for at lukke vinduet.
  24. Markér afkrydsningsfeltet Opret varehusmåltabel baseret på parametre.

    Et hak i afkrydsningsfeltet angiver, at datavarehuscentret skal oprette måltabellen ud fra de værdier, der er angivet på skillebladet Kolonneforbindelser.

  25. Vælg Varehusmål i oversigten Øvelsesmål.

    Varehusmålet er den database eller det filsystem, hvor måltabellen skal oprettes.

  26. Vælg skillebladet Kolonneforbindelser.
  27. Kontrollér, at kildekolonnerne er knyttet til de rigtige målkolonner.
    Figure db2tu019 not displayed.
  28. Vælg skillebladet Behandlingsvalg.
  29. Vælg Erstat i oversigten Type udfyldning.
  30. Kontrollér, at afkrydsningsfeltet Udfør efter behov er markeret.

    Godkend resten af standardværdierne på skillebladet. Der er flere oplysninger om værdierne på skillebladet i onlinehjælpen.

  31. Vælg OK.

    Notesbogen Trin lukkes. Datavarehuscentret opretter en måltabel med navnet "Select_Geog_T". Måltabellens navn står i anførselstegn, fordi det består af både store og små bogstaver.

  32. Ret navnet på måltabellen:

    1. Klik med højre museknap på måltabellen "Select_Geog_T".
    2. Klik på Indstillinger.

      Notesbogen Tabel åbnes.

    3. Skriv IWH i feltet Tabelskema.
    4. Skriv tabellens navn i feltet Tabelnavn:
      GEOGRAPHIES_TARGET
      
    5. Beskriv tabellen i feltet Beskrivelse:
      Automatisk genereret måltabel til trinet Vælg geografiske data.
      
    6. Skriv et beskrivende navn til tabellen i feltet Virksomhedsnavn:
      Geografisk måltabel
      
    7. Fjern markeringen fra afkrydsningsfeltet Del af et OLAP-skema.
    8. Vælg skillebladet Kolonner for at få vist kolonnedefinitionerne.
    9. Vælg OK. Notesbogen Tabel lukkes.

Definér trinet Sammenkæd markedsdata

Sådan defineres trinet Sammenkæd markedsdata:

  1. Vælg ikonen SQL på paletten.
  2. Klik det sted på lærredet, hvor trinet skal placeres.

    Der vises en ikon for trinet i vinduet.

  3. Klik på trinet med højre museknap.
  4. Klik på Indstillinger.

    Notesbogen Trin åbnes.

  5. Skriv navnet på trinet i feltet Navn:
    Sammenkæd markedsdata
    
  6. Skriv dit navn i feltet Administrator som kontaktperson for trinet.
  7. Beskriv trinet i feltet Beskrivelse:
    Sammenkæder tabellen Geographies med tabellen Demographics
    
  8. Vælg OK.

    Notesbogen Trin lukkes.

  9. Vælg ikonen Opgavestrøm:
    Figure arrowcol not displayed.
  10. Vælg ikonen Dataforbindelse:
    Figure arrowgry not displayed.
  11. Klik i midten af kildetabellen Geographies, og flyt musen til trinet Sammenkæd markedsdata. Gentag dette trin med måltabellen Demographics og trinet Sammenkæd markedsdata.

    Datavarehuscentret viser en streg, som angiver, at kildetabellen Geographies indeholder kildedataene til trinet.

    Da du skal angive, at datavarehuscentret skal oprette måltabellen, behøver du ikke at oprette en sammenkædning til en måltabel i dette trin.

  12. Klik med højre museknap på trinet Sammenkæd markedsdata.
  13. Klik på Indstillinger.

    Notesbogen Trin åbnes.

  14. Vælg skillebladet SQL-sætning.
  15. Vælg Byg SQL for at få datavarehuscentret til at oprette SQL-sætningen. Du kan også selv indtaste SQL-sætningen.

    SQL-assistent åbnes.

  16. Vælg skillebladet Tabeller.
  17. Kontrollér, at tabellerne DEMOGRAPHICS_TARGET og GEOGRAPHIES_TARGET er markeret.
  18. Vælg skillebladet Kolonner.
    Sætningen GEOGRAPHIES SELECT på skillebladet SQL-sætning.
  19. Vælg >> for at føje alle kolonnerne i tabellerne Geographies og Demographics til oversigten Outputkolonner.
  20. Vælg DEMOGRAPHICS_TARGET.STATE i oversigten Outputkolonner.
  21. Vælg <.

    Kolonnen DEMOGRAPHICS_TARGET.STATE flyttes til oversigten Tilgængelige kolonner.

  22. Klik på DEMOGRAPHICS_TARGET.CITY.
  23. Vælg <.

    Kolonnen DEMOGRAPHICS_TARGET.CITY flyttes til oversigten Tilgængelige kolonner.

  24. Du behøver ikke kolonnerne DEMOGRAPHICS_TARGET.STATE og DEMOGRAPHICS_TARGET.CITY, fordi de allerede er defineret i tabellen GEOGRAPHIES_TARGET table. Du skal sammenkæde alle tabellerne vha. kolonnen CITY, som er entydig, i begge tabeller.

  25. Vælg Tilføj.

    Vinduet Byg udtryk åbnes.

  26. Skriv følgende CASE-sætning i feltet Udtryk:
    case 
    when POPULATION < 9000000   then 1
    when POPULATION < 15000000  then 2
    Else				 3
    end
    

    Figure db2tu062 not displayed.
  27. Vælg OK.

    Der føjes en ny kolonne til oversigten Valgte kolonner.

  28. Vælg feltet Navn i den nye kolonne, og skriv kolonnens navn:
    SIZE_ID
    
  29. Tryk på Enter.
  30. Klik på Flyt op for at rykke kolonnen SIZE_ID op over kolonnen POPULATION.
  31. Vælg skillebladet Sammenkædninger.
  32. Vælg kolonnen CITY i tabellen GEOGRAPHIES.
  33. Vælg kolonnen CITY i tabellen DEMOGRAPHICS.
  34. Vælg Sammenkæd.

    SQL-assistent viser en streg mellem CITY-kolonnerne for at angive, at tabellerne er sammenkædet via den kolonne.


    Sætningen GEOGRAPHIES SELECT på skillebladet SQL-sætning.

  35. Vælg skillebladet Gennemse for at få vist den SQL-sætning, du har bygget.
  36. Vælg OK.

    SQL-assistent lukkes.

  37. Markér afkrydsningsfeltet Opret varehusmåltabel baseret på parametre.

    Et hak i afkrydsningsfeltet angiver, at datavarehuscentret skal oprette måltabellen ud fra de værdier, der er angivet på skillebladene SQL-sætning og Kolonneforbindelser.

  38. Vælg Varehusmål i oversigten Øvelsesmål.
  39. Vælg skillebladet Kolonneforbindelser.
  40. Kontrollér, at kildekolonnerne er knyttet til de rigtige målkolonner.
  41. Vælg skillebladet Behandlingsvalg.
  42. Vælg Erstat i oversigten Type udfyldning.
  43. Markér afkrydsningsfeltet Udfør efter behov, så trinet udføres, når der er brug for det.

    Godkend resten af standardværdierne på skillebladet. Der er flere oplysninger om værdierne på skillebladet i onlinehjælpen.

  44. Vælg OK.

    Notesbogen Trin lukkes.

  45. Ret navnet på måltabellen:

    1. Klik med højre museknap på måltabellen "Join_Market_T".
    2. Klik på Indstillinger.

      Notesbogen Tabel åbnes.

    3. Skriv IWH i feltet Tabelskema.
    4. Skriv det nye navn på tabellen i feltet Tabelnavn:
      LOOKUP_MARKET
      
    5. Beskriv tabellen i feltet Beskrivelse:
      Markedsdimensionsdata
      
    6. Sørg for, at afkrydsningsfeltet Del af et OLAP-skema og valgknappen Dimensionstabel er markeret.

      Denne tabel er en af de dimensionstabeller, der skal inkluderes i et stjerneskema i Øvelse 16, Opret et stjerneskema i datavarehuscentret.

    7. Vælg skillebladet Kolonner for at få vist kolonnedefinitionerne.
    8. Fjern markeringen fra afkrydsningsfeltet Kan indeholde NULL for kolonnen CITY ID. Kolonnen skal defineres som primærnøgle for tabellen i Øvelse 11, Definér nøgler på måltabeller.
    9. Vælg OK. Notesbogen Tabel lukkes.

    Figure db2tu042 not displayed.

Resumé

Du har defineret dimensionstabellen LOOKUP_MARKET i processen Markedsøvelse, som indeholder tre trin:

Kilderne og målene for hvert af trinene er:
Trin Kilder Mål
Indlæs demografiske data Filen Demographics Måltabellen Demographics
Vælg geografiske data Tabellen Geographies Måltabellen Geographies
Sammenkæd markedsdata Måltabellen Demographics og måltabellen Geographies Tabellen LOOKUP_MARKET

Til øvelsen har du tilføjet dataforbindelser for hvert trin, da du definerede egenskaberne for trinene. Du kan også udføre opgaven ved at tilføje alle trinene i processen på én gang, sammenkæde trinene med deres kilder og mål og derefter definere egenskaberne for hvert enkelt trin. Datavarehuscentret tildeler standardnavne til trinene, som du kan ændre i notesbogen Trin.


Definér resten af stjerneskemaet (valgfrit)

Tabellen LOOKUP_MARKET, som du har oprettet i forrige afsnit, er en af dimensionstabellerne i eksemplet i Eksempelproblemet i øvelserne. Dette afsnit beskriver de trin, der skal udføres for at opbygge resten af dimensionstabellerne og faktatabellen til stjerneskemaet.

Afsnittet er valgfrit, men hvis du ikke udfører trinene i afsnittet, kan du ikke udføre følgende øvelser:

Hvis du vil springe afsnittet over, skal du gå videre til Øvelse 9, Test varehustrin.

Hver gang du definerer en tabel, skal du definere en ny proces til tabellen. I stedet for at definere dit eget trin til processen skal du kopiere det trin, der er defineret i eksemplet. Definitionen af trinet findes i det datavarehuscenter, som du bruger. Når du kopierer trinet, kopierer datavarehuscentret de kilder, som trinet bruger, og genererer en måltabel.

Sådan defineres produktdimensionstabellen:

  1. Definér en ny proces ved at følge trinene i Definér proces. Kald processen Øvelsesprodukt.
  2. Udvid træstrukturen i hovedvinduet i Datavarehuscenter, indtil processen Øvelsesprodukt vises.
  3. Klik med højre museknap på processen Øvelsesprodukt.
  4. Vælg Åbn.

    Vinduet Procesmodel åbnes.

  5. Klik med højre museknap på trinet Vælg produkt.
  6. Vælg Kopiér.

    Vinduet Kopiér trin åbnes.

  7. Skriv et navn til kopien af trinet i feltet Navn:
    Vælg øvelsesprodukt
    
  8. Vælg eller skriv navnet på den proces, som du vil kopiere trinet til, i feltet Ny proces:
    Øvelsesprodukt
    
  9. Kontrollér, at afkrydsningsfeltet Kopiér måltabel er markeret.
  10. Vælg varehusmålet Øvelsesmål i oversigten i feltet Varehusmål.
    Sætningen GEOGRAPHIES SELECT på skillebladet SQL-sætning.
  11. Vælg OK.

    Trinet og dets kilder kopieres til processen Øvelsesprodukt. Datavarehuscentret opretter den tilsvarende måltabel.

  12. Åbn processen Øvelsesprodukt ved at følge trinene i Åbn proces.
  13. Kontrollér, at processen indeholder følgende objekter:
  14. Omdøb måltabellen TARGET_PRODUCT til LOOKUP_PRODUCT.

Gentag denne fremgangsmåde for resten af dimensionstabellerne og faktatabellen.
Dimension Øvelses- proces Eksempel- tid Eksempel- trin Øvelses- trin Varehus- mål Kildetabeller Måltabel Nyt navn på måltabel
Tidspunkt Tidspunkt for øvelse Målingstidspunkt Vælg tidspunkt Vælg tidspunkt for øvelse Øvelsesmål TIME
TARGET_
TIME


LOOKUP_
TIME

Scenarie Øvelsesscenarie Eksempel- scenarie Vælg scenarie Vælg øvelses- scenarie Øvelsesmål SCENARIO
TARGET
_SCENARIO


LOOKUP_
SCENARIO

Faktatabel Faktatabel til øvelse Eksempel- faktatabel Faktatabel- sammen- kædning Sammen- kædning af faktatabel til øvelse Øvelsesmål
SALG,
LAGER
og
PRODUKT
_OMKOSTN.


TARGET_
FACT_
TABLE


FACT_
TABLE


Resumé

Du har nu defineret fem processer med tilhørende kilder, mål og trin i datavarehuscentret:


[ Øverst på siden | Forrige side | Næste side | Indholdsfortegnelse ]