Metadata is een breed begrip. Simpel gezegd is het ‘data over data’. Metadata geeft de context die nodig is om data goed te kunnen registreren, beheren en interpreteren. Zonder metadata weet je niet wat de betekenis van de data is, wat de herkomst is en of je erop kunt vertrouwen.

Welke soorten metadata zijn er?

Er zijn beschrijvende en administratieve metadata. Beschrijvende metadata zijn bijvoorbeeld definities, classificaties en eisen aan de datakwaliteit die je al voor de creatie kunt opstellen. Administratieve metadata is de informatie die je vastlegt gedurende de levenscyclus, van creatie tot vernietiging: waar en wanneer is de data ontstaan en wie heeft de data gemuteerd? Verder kan metadata business-georiënteerd of meer technisch van aard zijn. Denk bij technische metadata bijvoorbeeld aan tabel- en kolomnamen en eigenschappen, maar ook aan bestandsformaten en de bewerkingsslagen die data ondergaat van bron tot informatieproduct (data-lineage).

Waarom is een metadataverzameling zo waardevol?

Organisaties willen steeds meer datagedreven werken. Daarbij is data een belangrijke asset. Om goed met die data te kunnen werken, heb je informatie nodig. Welke data is er? Wat is de betekenis? Waar kan ik de data vinden? Wat mag ik ermee? Wat is de brondata achter dit informatieproduct? Welke bewerkingen heeft het ondergaan? Wat is de datakwaliteit? En wie is er verantwoordelijk voor?

Binnen een organisatie is er altijd wel iemand die het antwoord weet op sommige van deze vragen voor een specifieke dataset. En soms zijn er meerdere mensen die met een antwoord komen. Naar wie luister je dan? Het probleem is dat niemand alle antwoorden over alle data kan geven. Deze informatie moet geborgd worden in een goed toegankelijke metadataverzameling, anders kan een organisatie waardevolle kennis over zichzelf verliezen.

Door de verbanden die je legt, is deze verzameling meer dan de losse metadatacomponenten. Zo ondersteunt een goed opgezette metadataomgeving ook de impactanalyse. Welke informatiegebruikers moeten we bijvoorbeeld waarschuwen nu bronlevering X vertraagd is?

Data zorgvuldig beheren is niet alleen een kennismanagementuitdaging. Ook vanuit compliance- en riskmanagementoogpunt moet inzichtelijk zijn welke gevoelige (persoons)gegevens worden verwerkt. Metadata is een voorwaarde om de data gedurende de gehele levenscyclus te beheren.

Waarom wordt metadata steeds belangrijker?

Organisaties genereren en verzamelen steeds meer data over hun klanten en transacties. De aard van deze data loopt uiteen. Dit komt hoofdzakelijk door technologische ontwikkelingen en mogelijkheden zoals social media en ‘Internet of things’. Daarnaast neemt ook het aantal analysemogelijkheden en – omgevingen toe. Data wordt niet alleen on-premise, maar ook in de cloud opgeslagen. Door deze ontwikkelingen wordt het steeds lastiger om het overzicht over je data te behouden.

Aan de gebruikerszijde stellen ontwikkelingen zoals self-service en samenwerking in de keten hogere eisen aan de kwaliteit en beschikbaarheid van data, en daarmee ook aan de metadata. Daarnaast willen organisaties snel en flexibel kunnen inspelen op ontwikkelingen in de markt. De benodigde IT-ontwikkelsnelheid die vanuit de business wordt verwacht, is alleen mogelijk als de metadata op orde is. En dan zijn er ook nog de toenemende eisen vanuit wet- en regelgeving. Denk hierbij aan de AVG, maar ook aan branchespecifieke regelgeving.

Hoe zorg je dat metadata op orde en toegankelijk is?

Net als ‘gewone data’ vergt metadata een vorm van management. Metadata moet je verzamelen en onderhouden, integreren en toegankelijk maken. Hiertoe richt je processen en ondersteunende technologie in en ken je rollen toe. Het is belangrijk te beseffen dat het om processen gaat en niet om een project of een eenmalige inspanning. Door de verschillende ideeën over metadata kunnen misverstanden ontstaan. Metadatamanagement moet een ‘business-as-usual’-activiteit zijn. Ten aanzien van de rollen binnen de processen moet je bepalen wie voor welke data de verantwoordelijkheid voor de metadata heeft, als onderdeel van zijn of haar lijnactiviteiten.

Qua ondersteunende technologie is het van belang een metadata-omgeving te selecteren of realiseren die voldoet aan de eisen van zowel business- als IT-gebruikers. Een voorbeeld van zo’n eis is het snel kunnen opzoeken van definities. Metadata-omgevingen maken dit eenvoudig via een search-engine, indien mogelijk direct gekoppeld vanuit een rapportagetool waarin de businessgebruiker werkt. Een ander voorbeeld is het kunnen uitvoeren van impactanalyses zoals: welke informatieproducten worden geraakt als er iets mis is met de kwaliteit van data in een bron?

Maar waar begin je, als je een raamwerk van processen, rollen en ondersteunende tooling hebt staan? Je kunt niet met alle data in de organisatie gelijktijdig aan de slag gaan. Daarom moet je eerst bepalen wat de kritische data-elementen (KDE’s) zijn om businessdoelstellingen te kunnen realiseren. Zodra je successen hebt geboekt met zichtbaar toegevoegde waarde, kun je vervolginitiatieven gaan starten. Zo groeit de scope van de metadataverzameling en daarmee ook de waarde ervan.

Meer weten?

Wil je weten hoe je je organisatie metadatagedreven maakt? Neem dan contact met ons op voor een vrijblijvend gesprek. Wil je eerst meer weten over een aanpak om metadata op orde te brengen? In onze e-paper geven we praktische tips voor de succesvolle implementatie van metadatamanagement.