In 5 stappen naar een succesvol datawarehouse (DWH)
In een datawarehouse wordt data uit verschillende bronnen binnen een organisatie verzameld, gecombineerd en aangeboden. Daarmee kan een datawarehouse waardevolle inzichten opleveren voor de organisatie. In de praktijk maken nog veel organisaties de fout om een datawarehouse te benaderen vanuit de techniek: de organisatie wordt verleid met een mooie tool en vaart blind op de aantrekkelijke visualisaties die in het vooruitzicht gesteld worden. Maar een datawarehouse heeft als belangrijkste doel te kunnen voldoen aan de informatiebehoeften die er zijn binnen de organisatie. Dat dient ook het startpunt te zijn: waar heeft de eindgebruiker behoefte aan?
In dit blog vind je een praktisch stappenplan voor het opzetten van een succesvol datawarehouse. Wil je liever direct op weg worden geholpen met een succesvolle implementatie van een datawarehouse? Download dan onze de checklist.
Ook al is het concept van een datawarehouse intussen alweer zo’n dertig jaar in omloop, ook in de huidige wereld van Big Data en Advanced Analytics biedt het nog steeds een duidelijke meerwaarde. Aan de slag!
Stap 1. Achterhaal de informatiebehoefte
Neem de organisatie als uitgangspunt. Werk vanuit de strategie toe naar de belangrijkste informatiebehoeften. Welke inzichten heeft de organisatie nodig om gericht te kunnen sturen? Werk een procesmodel uit: met welke processen en welke gegevens werkt de organisatie? Start ook met het functioneel modelleren van de organisatie: werk een bedrijfsobjectenmodel uit. Bedrijfsobjecten zijn alle gegevensobjecten die van belang zijn binnen een organisatie. Van deze objecten kunnen eigenschappen worden vastgelegd met behulp van data.
Stap 2. Ga na welke gegevensbronnen nodig zijn
Welke gegevensbronnen zijn nodig om in de informatiebehoeften van de organisatie te kunnen voorzien? Welke bronnen zijn er al en welke moeten er eventueel nog worden gecreëerd? Bedenk ook hoe de gegevens er uitzien. Zijn ze makkelijk te ontsluiten of niet? Wat is de kwaliteit van de data? Hoe goed zijn alle velden ingevuld? Maar ook: wat voor gegevenselementen bevatten ze? Houd ook rekening met de privacy van de betrokkenen: gaat het om gevoelige gegevens? Bijzondere persoonsgegevens, bijvoorbeeld over iemands etniciteit, gezondheid of levensovertuiging, worden door de wetgever extra beschermd. Je mag alleen bijzondere persoonsgegevens verwerken als je je kunt beroepen op een wettelijke uitzondering.
Stap 3. Stel een roadmap op
Op basis van de informatiebehoeften binnen de organisatie en de kennis van de gegevensbronnen maak je een afweging: wat pak je als eerste op? Wat is de meest logische keuze? Je kunt bijvoorbeeld starten met een relatief klein deelproject dat naar verwachting snel tot resultaat leidt, om het succes van het datawarehouse te kunnen aantonen. Een valkuil is om eerst alle gegevens te verzamelen en alle data met elkaar te combineren om tot een uniform en veelomvattend model te komen van de gehele organisatie. Deze werkwijze kost veel tijd. Tegen de tijd dat het datawarehouse opgeleverd kan worden, is de kans groot dat de organisatie, de informatiebehoefte en de gegevenshuishouding veranderd zijn. Houd het grotere plaatje voor ogen, maar begin klein en blijf continu herijken.
Bij een urgente informatiebehoefte of weerstand binnen de organisatie kun je kiezen voor een zogenaamd ‘snelspoor’: je levert dan bijvoorbeeld nog geen historische data en volledige integratie van gegevensbronnen op, maar wél alvast een rapportage op basis van één bronsysteem. Daarmee heb je in een kort tijdsbestek al een informatieproduct beschikbaar, waarmee de eindgebruiker met de urgente behoefte alvast geholpen is. Bovendien kun je de meerwaarde van het DWH hiermee al snel in de praktijk aantonen. Dit vergroot het draagvlak voor vervolgtrajecten.
Stap 4. Kies een datawarehouse architectuur en technologie
Bij deze stap komt de techniek om de hoek kijken. Welke modelleringstechnieken kies je voor het datawarehouse? Zet je het datawarehouse op volgens Kimball, Inmon of wordt het een datavault-model volgens Linstedt? Welke lagen creëer je? Denk bijvoorbeeld aan een drielagenmodel, dat aansluit bij de drie functies van een datawarehouse (verzamelen, integreren en aanbieden). En kies je voor een datawarehouse in de cloud of niet? Houd ook rekening met de plaats van ontwikkelingen zoals realtime data en datavirtualisatie.
Stap 5. Lever het datawarehouse op
In de voorgaande vier stappen heb je de blauwdruk van het datawarehouse uitgetekend. Nu is het tijd om het datawarehouse daadwerkelijk te bouwen en op te leveren. Vaak resulteert deze stap in een rapportage of dashboard voor een eindgebruiker. Maar om daar te komen is het belangrijk om de tussenstappen, de verschillende lagen in het datawarehouse, op te leveren als ze klaar zijn. Wacht daar niet mee tot het eindproduct af is. Gebruik een werkwijze als DevOps om regelmatig werkende halffabricaten of producten op te leveren.
Om van het datawarehouse écht een succes te maken binnen de organisatie, is het belangrijk dat de gebruikers ermee leren omgaan. Deze laatste stap draait dus niet alleen om het opleveren van het datawarehouse, maar ook om het implementeren van een datagedreven cultuur. Hoe kunnen de eindgebruikers sturen en verantwoorden op basis van de data? Wat moeten zij weten van het datafundament om er het beste rendement uit te halen?
Meer weten?
Een datawarehouse dient zorgvuldig te worden ingebed in de organisatie. Wij helpen je op weg met een handige checklist voor een succesvolle implementatie van een datawarehouse.