5 hardnekkige misverstanden over metadata
Metadata is een begrip waarbij veel verschillende beelden bestaan. Wat is metadata? Wat is het belang ervan? Welke vormen kent het? Wie gebruikt het en voor welke toepassing? De antwoorden die iemand geeft op deze vragen, hangen sterk af van zijn of haar achtergrond. Toch is metadata van cruciaal belang voor iedere organisatie. Zonder metadata zou data niet gevonden worden en zou het gissen zijn naar de betekenis en kwaliteit. Of positief: metadata zorgt ervoor dat je de stap kunt maken van guessbased naar factbased besluitvorming en besturing van de organisatie.
Door de verschillende ideeën over metadata kunnen ook misverstanden ontstaan. In dit blog lichten we de vijf meestvoorkomende misverstanden toe:
- Metadata krijgt te veel aandacht
- Metadata kost vooral tijd en geld
- Metadata kan zonder data-architectuur
- Metadata is aan de IT-afdeling
- Metadata is een project
Metadata krijgt te veel aandacht
Vooral in organisaties waar de volwassenheid van de data-omgeving nog laag is, wordt vaak gedacht dat metadata te veel aandacht krijgt. De beleving is: we hebben geen issues met onze data, dus waarom zouden we werken aan metadata? Er is weinig bewustzijn van het belang van data en datakwaliteit voor het behalen van de bedrijfsdoelstellingen.
Onze ervaring is dat iedere organisatie vroeg of laat bij een kantelpunt komt. Vaak ontstaat het bewustzijn door een incident dat intern veel aandacht heeft gekregen of zelfs de publiciteit heeft gehaald en geresulteerd heeft in imagoschade. Soms is het bij een organisatie zelfs zo ver gekomen dat datakwaliteit als bedrijfsrisico nummer één wordt gezien: het voortbestaan van de organisatie is in gevaar. Als het besef eenmaal is doorgedrongen dat data een kritische bedrijfsasset is, ontstaan er allerlei vragen.
Om deze vragen te kunnen beantwoorden, is metadata nodig. Scherper gesteld: zonder metadata is een datagedreven organisatie niet mogelijk.
Metadata kost vooral tijd en geld
Kijk je alleen naar de eerstvolgende projectoplevering en is er onvoldoende sturing op de kwaliteit? Dan kan de indruk ontstaan dat het definiëren van metadata vooral tijd en geld kost, zonder dat het iets oplevert. Maar niets is minder waar. Het patroon dat door deze kortzichtigheid ontstaat, kan een sneeuwbaleffect veroorzaken:
- Er worden IT-oplossingen gecreëerd waarbij onvoldoende aandacht is besteed aan definities. Zonder goede definities is een goede datakwaliteit niet mogelijk of meetbaar. Slechte datakwaliteit kost veel (vaak verborgen) tijd. De almaar terugkomende inspanning voor het uitzoeken en herstellen van fouten en verschillen in cijfers is vaak vele malen groter dan de initiële inspanning om de juiste definities op te stellen.
- Als het project niet direct faalt (want dat is zeker een risico zonder de juiste metadata) dan is het vervolgens toeval als de data uit de IT-oplossing aansluit bij de data uit andere systemen. Bovendien vergt het een flinke investering om deze data in een datawarehouse weer onder één noemer te brengen.
- Vaak blijkt dat er toch een minimale set aan definities nodig is. Hiervoor wordt binnen een project dan alsnog een aanzienlijke inspanning geleverd. Die definities verdwijnen vervolgens maar al te vaak in projectdocumentatie en worden niet met de organisatie gedeeld.
- Enkele jaren later mag je van geluk spreken als je de opgestelde definities nog kunt terugvinden. Maar al te vaak zijn de definities verloren gegaan en begint de cyclus noodgedwongen opnieuw. Dan zit er niets anders op dan de kennis over de data weer uit te vragen bij vaak drukbezette sleutelpersonen. Soms is de kennis door uitstroom van medewerkers zelfs verloren gegaan.
Kortom: het eenmalig registreren en goed borgen van metadata werkt uiteindelijk tijd- en kostenbesparend en maakt een organisatie intelligenter, slagvaardiger en flexibeler.
Metadata kan zonder data-architectuur
Veel organisaties onderhouden een gemeenschappelijke set van business-termen met bijbehorende definities. Dat helpt in de communicatie over het werk. Maar om snel en efficiënt applicaties te ontwikkelen die het werk ondersteunen én om datamanagement mogelijk te maken, is een data-architectuur-tussenstap nodig.
De business-termen representeren onderwerpen of gebeurtenissen waarvoor data wordt geregistreerd. Data die nodig is voor de optimale uitvoering en besturing van de bedrijfsvoering. Een data-architect benoemt de objecten samen met de business. In een conceptueel model beschrijf je de objecten en de samenhang daartussen, vaak in een specifieke context (bijvoorbeeld verkoop of service).
De samenvoeging van een geïntegreerde set conceptuele modellen vormt de fundering van de datahuishouding en informatievoorziening van je organisatie. Het geeft richting aan logische datamodellen voor applicaties die de bedrijfsvoering ondersteunen, aan masterdatamanagement, maar ook aan het datafundament voor een organisatiebreed opgezet datawarehouse. Ook ondersteunt het bij het definiëren van de informatiebehoefte voor het (datagedreven) optimaliseren van bedrijfsprocessen. In een metadataverzameling komt de kennis over de data en bovengenoemde toepassingen samen. Voor de inrichting van een metadatarepository biedt de data-architectuur de benodigde kaders. Denk hierbij aan het definiëren van de data-assets en domeinindelingen.
Kortom: metadata kan niet zonder data-architectuur.
Metadata is aan de IT-afdeling
In organisaties waar datagedreven werken relatief nieuw is, denken medewerkers vaak dat metadata ‘iets technisch’ is. De IT-afdeling zou dit moeten regelen. In het verleden was het ook vaak een functioneel beheerder of informatieanalist die zich verantwoordelijk voelde voor de metadata. Data heeft echter zowel business- als IT-aspecten die met elkaar samenhangen.
Neem bijvoorbeeld het data-element ‘klant’. Het zijn de data-eigenaar en datastewards in de business die de juiste eenduidige definitie van ‘klant’ onderling afstemmen en vaststellen. Zij weten hoe de organisatie tegen de term ‘klant’ aankijkt, en hoe zij deze in hun managementrapportages willen terugzien. Vervolgens zijn het de IT-architecten en IT-ontwikkelaars die bepalen in welke systemen en tabellen welke klantdata op welke wijze wordt vastgelegd, beheerd en wederom ontsloten.
In de praktijk zijn het dan ook vaak datamanagementspecialisten of -teams die de afstemming tussen business en IT faciliteren.
Metadata is een project
Toegegeven: het is mogelijk om de initiële inrichting van een metadata-omgeving in een projectvorm te verwezenlijken. Dat geldt ook voor bijvoorbeeld een inhaalslag in geval van incomplete metadata voor een specifiek domein. Maar uiteindelijk is het onderhouden en kunnen delen van metadata een doorlopend proces. De business en de processen waarin je data registreert en gebruikt, wijzigen in de tijd, en daarmee wijzigt ook de bijbehorende metadata per definitie. Het kan bijvoorbeeld gaan om nieuwe data (zoals IoT), extra attributen of gewijzigde business-rules. Het kan ook zijn dat de noodzaak en behoefte aan metadata wijzigt, bijvoorbeeld door regelgeving.
Ter vergelijking: HR en Finance zijn ook geen projecten, maar ondersteunende processen en bijbehorende stafafdelingen.
Herkenbaar?
Herken je een of meerdere van deze misverstanden in jouw organisatie? Wil je deze uit de wereld helpen en zoek je daarbij ondersteuning? Neem dan contact met ons op.
Wil je meer weten over een aanpak om metadata op orde te brengen? Lees dan onze e-paper, waarin we praktische tips geven voor de succesvolle implementatie van metadatamanagement.