Zes dimensies van datakwaliteit

18 okt. 2022
detail-website-zesdemensies.png

Nu elk bedrijf een databedrijf wordt, is het verbeteren van deze grondstof van cruciaal belang om een belangrijke speler in de markt te blijven. Datakwaliteit is het meten van de conditie van eigen data. Zo zorgt het ervoor dat de data van uw organisatie passen bij uw doel. Het helpt organisaties ook om fouten in databestanden op te sporen die moeten worden opgelost. Het is van cruciaal belang om betrouwbare data te hebben waarop u kunt vertrouwen. Alleen dan kunt u belangrijke zakelijke beslissingen te nemen.

Zes dimensies van datakwaliteit

Dit is de theorie. Dat is duidelijk. Maar hoe kunt u een goed onderscheid maken tussen goede en slechte data? Er zijn 6 dimensies van datakwaliteit die gemeten kunnen worden. 

  • Consistentie: datawaarden uit verschillende databases moeten overeenkomen of op elkaar afgestemd zijn. Dit betekent dat data niet tegenstrijdig zijn in uw databases. Als u bijvoorbeeld kijkt naar uw R&D-budget in het bedrijf, moet dit in elke database hetzelfde zijn en mag het niet hoger zijn dan het totale budget voor dat jaar.
  • Nauwkeurigheid: De data zijn correct en exact. Een gemeten waarde moet overeenkomen met de werkelijke waarde en mag geen fouten bevatten.
  • Volledigheid: Er zijn geen ontbrekende of onvolledige waarden in de dataset. Voor een dataset van hoge kwaliteit moeten alle gegevens volledig zijn.
  • Geldigheid: Datavaliditeit zorgt voor juistheid en redelijkheid van data. Dit betekent dat alle datapunten dezelfde en correcte regels moeten volgen. Dus bijvoorbeeld percentages afronden op een heel getal of data allemaal op dezelfde manier formatteren. Worden op een gegevenspunt andere regels gebruikt, dan is dat een fout.
  • Uniciteit: data worden niet meer dan één keer opgenomen binnen de dataset. U kunt echter hetzelfde datapunt op meerdere manieren gebruiken, zoals kosten die zowel in een management- als in een verkooprapport verschijnen. Maar u kunt de data niet dupliceren, door twee keer hetzelfde getal in een bepaald rapport op te nemen. 
  • Tijdigheid: data is beschikbaar, nauwkeurig en worden zo vaak als nodig bijgewerkt. U moet uw data bekijken en nagaan hoe vaak u de data moet bijhouden. Heeft de data impact op korte termijn, dan is het beter om de data maandelijks te meten in plaats van jaarlijks.  

Als de data van uw organisatie aan al deze dimensies voldoen, kunt u spreken van goede data kwaliteit. Al deze dimensies zijn belangrijk om datakwaliteit te meten, maar sommige organisaties moeten zich meer richten op één dimensie dan op andere om specifieke hoofddoelen van uw organisatie te ondersteunen.

De voordelen

Nu weten we wat datakwaliteit is en hoe je het kunt meten, maar waarom zouden we ons zo druk maken over goede datakwaliteit? Correcte data hebben veel voordelen. 

Ten eerste kan het organisaties helpen betere zakelijke beslissingen te nemen. Als de gegevens van goede kwaliteit zijn, is het gemakkelijker om ze te verwerken en te analyseren. Dit leidt tot betere inzichten voor de organisatie en eenvoudigere besluitvorming. 

Ten tweede leidt het tot meer productiviteit en efficiëntie. Als alle benodigde informatie in één dataset van goede kwaliteit zit, kunnen teams direct alle informatie zien die ze nodig hebben. Moeten ze werken met de ruwe ongecontroleerde gegevens, dan moeten ze die telkens zelf controleren en meerdere datasets openen. Het controleren van alle onjuiste of ontbrekende waarden kost veel tijd, dus wanneer teams slechts één zeer goede dataset kunnen openen, kan de efficiëntie enorm toenemen. 

Ten derde zijn de kosten van incorrecte data zeer hoog. Er zijn meerdere onderzoeken gedaan naar dit onderwerp, waaruit ook het belang van datakwaliteit blijkt. IBM heeft ooit berekend dat de jaarlijkse kosten van datakwaliteitsproblemen in de VS 3,1 biljoen dollar bedragen. Uit ander onderzoek van o.a. MIT Sloan bleek dat het omgaan met de gevolgen van slechte data een bedrijf ongeveer 15%-25% van de jaarlijkse omzet kost. 

En u?

U vraagt zich misschien af, wat zijn die fouten en waarom zijn de kosten zo hoog? Enkele voorbeelden van wat slechte data kunnen veroorzaken zijn extra kosten wanneer de verzending van bepaalde producten fout gaat. Als het verkeerde product naar een klant wordt gestuurd, moet u er eerst voor zorgen dat de juiste bestelling wordt geleverd en meestal krijgt de klant ook nog een kortingsbon om de fout goed te maken. Bovendien kan het bedrijf boetes krijgen als hun jaarrekening niet goed wordt gerapporteerd. En als u niet over de juiste klantdata beschikt, kunt u zich op de verkeerde klantengroep richten en dat kan leiden tot minder verkoop dan wanneer u zich op de juiste groep had gericht. Als u inzicht wilt hebben in de kwaliteit van uw gegevens, waarom maakt u dan geen afspraak met een deskundige datadokter die u kan helpen en een eerste diagnose kan stellen? Wij staan klaar om u te helpen. Human Inference, ruim 35 jaar ervaring voor uw deur!