I denne leksjonen skal du definere hvordan datavarehussenteret skal flytte og transformere dataene til et format for datavarehuset. Først skal du definere en prosess, som består av en rekke trinn i transformasjons- og flytteprosessen. Deretter skal du oppgi kildetabellene som skal transformeres for varehuset. Til slutt skal du definere datatransformasjonstrinn som bruker to forskjellige metoder for tansformasjon:
Rent konkret skal du definere prosessen Opplæringsmarked, som utfører følgende prosesser:
Sluttresultatet er måltabellen LOOKUP_MARKET.
I denne øvelsen skal du definere prosessobjektet for prosessen Opplæringsmarked.
Gjør slik:
Notisboken Definer prosess blir åpnet.
Opplæringsmarked
Navnet kan ha opptil 80 tegn, og det skilles mellom store og små bokstaver. Første tegn i navnet må være alfanumerisk. Du kan ikke bruke & som første tegn.Dette feltet er obligatorisk.
Prosess for å opprette tabellen LOOKUP_MARKET
Når du tilføyer prosesser i sikkerhetsgruppen, lar du brukerne i gruppen (i dette tilfelelt deg) åpne og tilføye objekter i prosessen.
Varehusgruppe for opplæring blir flyttet til listen Valgte sikkerhetsgrupper.
Notisboken Definer prosess blir lukket.
I denne øvelsen skal du åpne prosessen, slik at du grafisk kan definere strømmen av data i prosessen i neste øvelse.
Slik åpner du prosessen Opplæringsmarked:
For å definere strømmen av data må du tilføye alle kilder som trinnene transformerer, og måltabellene som er resultatene av transformasjonen.
I prosessen Opplæringsmarked skal du laste filen demographics.txt inn i måldatabasen, så du må tilføye kildefilen og måltabellen DEMOGRAPHICS_TARGET for trinnet i prosessen. Kildefilen demographics.txt er en del av varehuskilden Filkilde for opplæring, som du definerte i Leksjon 6, Definere varehuskilder. Måltabellen DEMOGRAPHICS_TARGET er en del av varehusmålet Opplæringsmål, som du definerte i Leksjon 7, Definere varehusmål.
Slik tilføyer du filen demographics.txt:
Klikk på lerretet på det punktet der du vil plassere tabellen. Vinduet Tilføy data blir åpnet.
Du får frem en liste over kildene som er definert i varehuset.
I oversikten skal du kunne se X:\sqllib\samples\db2sampl\dwc\demographics.txt, der X er stasjonen der du installerte eksempelet.
Slik tilføyer du måltabellen DEMOGRAPHICS_TARGET:
Du får frem en liste over varehusmålene som er definert i varehuset.
Du skal kunne se måltabellen DEMOGRAPHICS_TARGET på listen.
I neste del av øvelsen må du tilføye kildetabellen GEOGRAPHIES. Når du definerer et trinn som velger data fra tabellen GEOGRAPHIES, kan du oppgi at datavarehussenteret automatisk skal generere en måltabell, slik at du ikke behøver å tilføye en måltabell.
Slik tilføyer du kildetabellen GEOGRAPHIES:
Filen og tabellene som du valgte, blir vist i vinduet Prosessmodell.
Siste trinn vil bruke tabellene Demographics og Geographies som kilder, så du behøver ikke å oppgi kilder for trinnet. Du kan oppgi at datavarehussenteret automatisk skal generere måltabellen, LOOKUP_MARKET, slik at du ikke behøver å oppgi måltabell i neste trinn.
Du må tilføye trinnene som definerer hvordan kildedataene skal transformeres til måldata. Du må definere tre trinn:
I denne øvelsen skal du definere trinnet Last demografi:
Hvert programikon representerer en programgruppe, som er en gruppe med liknende programmer.
Programmene i en programgruppe overlapper fra programikonet.
Det blir tilføyd et ikon for trinnet i vinduet.
Notisboken Egenskaper for trinn blir åpnet.
Last demografidata
Last demografidata inn i varehuset
Notisboken Egenskaper for trinn blir lukket.
Du skal bruke ikonet Datalink til å definere flyten av data fra kildefilen, gjennom transformasjon i et trinn, til måltabellen.
Datavarehussenteret trekker en linje mellom filen og trinnet.
Det betyr at kildefilen Demographics inneholder kildedata for trinnet.
Det betyr at måltabellen DEMOGRAPHICS_TARGET inneholder måldata for trinnet.
Notisboken Egenskaper for trinn blir åpnet.
Godta resten av standardverdiene på siden.
Du kan hoppe over siden Kolonnetilordning, for Last program bruker ikke kolonnetilordningen til å generere måltabellen. Det genererer måltabellen på grunnlag av kildefilen.
Du finner flere opplysninger om verdiene på denne siden i "Laste data inn i en tabell" i hjelpefunksjonen.
Notisboken Egenskaper for trinn blir lukket.
I denne øvelsen skal du definere trinnet Velg geografidata:
Det blir tilføyd et ikon for trinnet i vinduet.
Notisboken Egenskaper for trinn blir åpnet.
Velg geografidata
Velg geografidata fra varehuskilden
Notisboken Egenskaper for trinn blir lukket.
Datavarehussenteret trekker en linje som viser at kildetabellen Geographies inneholder kildedata for trinnet.
Siden du skal oppgi at datavarehussenteret skal opprette måltabellen, behøver du ikke knytte en måltabell til trinnet.
Notisboken Egenskaper for trinn blir åpnet.
SQL Assist blir åpnet.
SQL Assist blir lukket.SQL-setningen du nettopp bygget, blir vist på
siden SQL-setning.
Datavarehussenteret returnerer eksempelresultatene av din SELECT-setning. Disse resultatene skulle være de samme som du fikk i Leksjon 3, Se gjennom kildedataene da du så på eksempeldataene for kildetabellen Geographies.
Når du velger denne valgruten, angir du at datavarehussenteret skal opprette måltabellen på grunnlag av verdier som er oppgitt på siden Kolonnetilordning.
Varehusmålet er databasen eller filsystemet der måltabellen skal opprettes.
Godta resten av standardverdiene på siden. Du finner flere opplysninger om verdiene på denne siden i hjelpefunksjonen.
Notisboken Egenskaper for trinn blir lukket. Datavarehussenteret genererer en måltabell kalt "Velg_geogra_T". Navnet på måltabellen står i anførselstegn fordi det inneholder blanding av små og store bokstaver.
Notisboken Tabell blir åpnet.
GEOGRAPHIES_TARGET
Selvgenerert måltabell for trinnet Velg geografidata.
Geografimål
Slik definerer du trinnet Kombiner markedsdata:
Det blir tilføyd et ikon for trinnet i vinduet.
Notisboken Egenskaper for trinn blir åpnet.
Kombiner markedsdata
Kombinerer geografitabellen med demografitabellen
Notisboken Egenskaper for trinn blir lukket.
Datavarehussenteret trekker en linje som viser at tabellene GEOGRAPHIES_TARGET og DEMOGRAPHICS_TARGET inneholder kildedata for trinnet.
Siden du skal oppgi at datavarehussenteret skal opprette måltabellen, behøver du ikke knytte en måltabell til trinnet.
Notisboken Egenskaper for trinn blir åpnet.
SQL Assist blir åpnet.
Kolonnen DEMOGRAPHICS_TARGET.STATE flyttes til listen Tilgjengelige kolonner.
Kolonnen DEMOGRAPHICS_TARGET.CITY flyttes til listen Tilgjengelige kolonner.
Du trenger ikke kolonnene DEMOGRAPHICS_TARGET.STATE og DEMOGRAPHICS_TARGET.CITY, fordi de allerede er definert i tabellen GEOGRAPHIES_TARGET. Du skal kombinere tabellene ved hjelp av kolonnen CITY i begge tabeller, som er unik.
Vinduet Expression Builder blir åpnet.
case when POPULATION < 9000000 then 1 when POPULATION < 15000000 then 2 Else 3 end
Det blir tilføyd en ny kolonne på listen Valgte kolonner.
SIZE_ID
SQL Assist trekker en strek mellom CITY-kolonnene, som betyr at tabellene er knyttet sammen med den kolonnen.
SQL Assist blir lukket.
Når du velger denne valgruten, angir du at datavarehussenteret skal opprette måltabellen på grunnlag av verdier oppgitt på sidene SQL-setning og Kolonnetilordning.
Godta resten av standardverdiene på siden. Du finner flere opplysninger om verdiene på denne siden i hjelpefunksjonen.
Notisboken Egenskaper for trinn blir lukket.
Notisboken Tabell blir åpnet.
LOOKUP_MARKET
Data for dimensjonen Market
Denne tabellen er en av dimensjonstabellene du skal ta med i et stjerneskjema i Leksjon 16, Opprette et stjerneskjema i datavarehussenteret.
Du definerte dimensjonstabellen LOOKUP_MARKET i prosessen Opplæringsmarked, som inneholder tre trinn:
Kildene og målene for hvert av trinnene er:
Trinn | Kilder | Mål |
---|---|---|
Last demografidata | Filen Demographics | Tabellen Demografimål |
Velg geografidata | Tabellen Geographies | Tabellen Geografimål |
Kombiner markedsdata | Tabellene Demografimål og Geografimål | Tabellen LOOKUP_MARKET |
For denne veiviseren tilføyde du datalinker for hvert trinn mens du definerte egenskapene for hvert trinn. Du kan også gjøre dette ved å tilføye alle trinnene i prosessen samtidig, knytte trinnene til kildene og målene, og deretter definere egenskapene for hvert trinn. Datavarehussenteret tildeler standardnavn til trinn som du endrer i notisboken Trinn.
Tabellen du opprettet i forrige del, LOOKUP_MARKET, er en av dimensjonstabellene i eksempelet i Problemstilling. Denne delen omfatter trinnene for bygging av resten av dimensjonstabellene og faktatabellen for stjerneskjemaet.
Denne delen er valgfri, men hvis du ikke fullfører trinnene her, kan du ikke gjøre følgende leksjoner:
Hvis du vil hoppe over denne delen, fortsetter du med Leksjon 9, Teste varehustrinn.
Når du definerer hver tabell, må du definere en ny prosess for tabellen. I stedet for å definere ditt eget trinn for prosessen skal du kopiere trinnet som er definert i eksempelet. Definisjonen av trinnet er i datavarehussenteret du bruker. Når du kopierer trinnet, kopierer datavarehussenteret kildene som trinnet bruker, og genererer en måltabell.
Slik definerer du dimensjonstabellen Product:
Vinduet Prosessmodell blir åpnet.
Du får frem vinduet Kopier trinn.
Velg produkt for opplæring
Opplæringsprodukt
Trinnet og kildene kopieres til prosessen Opplæringsprodukt. Datavarehussenteret genererer tilsvarende måltabell.
Gjenta dette for resten av dimensjonstabellene og faktatabellen.
Dimensjon | Opplærings- prosess | Sample Process | Eksempel- trinn | Opplærings- trinn | Varehus- mål | Kilde- tabeller | Måltabell | Nytt navn på måltabell |
---|---|---|---|---|---|---|---|---|
Time | Tutorial Time | Sample Time | Select Time | Velg opplæringstid | Opplæringsmål | TIME |
TARGET_ TIME |
LOOKUP_ TIME |
Scenario | Opplæringssituasjon | Sample Scenario | Select Scenario | Velg opplæringssituasjon | Opplæringsmål | SCENARIO |
TARGET _SCENARIO |
LOOKUP_ SCENARIO |
Faktatabell | Faktatabell for opplæring | Sample Fact Table | Fact Table Join | Tutorial Fact Table Join | Opplæringsmål |
SALES, INVENTORY ogPRODUCT _COSTS |
TARGET_ FACT_ Tabell (TABLE) |
FACT_ Tabell (TABLE) |
Du har nå fem prosesser og deres tilknyttede kilder, mål og trinn definert i datavarehussenteret: