Blog: Datakwaliteit: Een must voor betrouwbare rapportages

Datakwaliteit is het vergeten kindje in de Business Intelligence wereld. Ik merk dat organisaties vaak snel willen starten met het bouwen van rapportages om direct inzichten te krijgen, zonder dat er nagedacht wordt over de datakwaliteit.


 

Ik geef dan altijd het volgende voorbeeld ter illustratie: Je rijdt in een mooie nieuwe auto en ineens sta je stil, ook al geeft de brandstofmeter aan dat je nog meer dan een halve tank aan brandstof hebt. Wat blijkt? De meter gaf niet de juiste resultaten.

 

Als je stelt dat rijden in een mooie nieuwe auto de rapportage is en de weergave van sensoren een representatie van  de datakwaliteit is, dan wil je niet dat er vervuiling optreed waardoor je ineens stil komt te staan en daarmee de rapportage niet meer kunt vertrouwen.

 

Wat is datakwaliteit?

Het is lastig om een eenduidige definitie te geven van datakwaliteit. Feit is dat je datakwaliteit goed is als het doel om de data te gebruiken, wordt gehaald. Bijvoorbeeld: de juiste waardes laten zien in een management dashboard om sturing te geven aan de organisatie.

 

Er zijn zes dimensies die door de Data Management Community zijn gedefinieerd om de datakwaliteit te meten.
Deze regels geven een goed beeld van wat er allemaal valt onder datakwaliteit:

 

  • Volledigheid: Is alle data ingevoerd, ontbreekt er niets?
  • Uniekheid: Zitten er dubbele waardes in de data?
  • Tijdigheid: Wordt de juiste data opgevraagd voor een specifiek tijdspunt?
  • Validiteit: Is de data ingevoerd volgens vastgestelde regels?
  • Accuraatheid: Is de ingevoerde data correct?
  • Consistentie: Is de data gelijk op verschillende opslagplekken?

 

 

Waarom is datakwaliteit zo belangrijk?

Als de datakwaliteit onvoldoende is kan het een hoop kosten. Neem als voorbeeld het foutief invoeren van verkoopcijfers. Er zijn veel aspecten om rekening mee te houden. Krijgen duizendtallen een punt? Worden er decimalen gebruikt? Het wel of niet gebruiken van een komma of een punt? Worden er symbolen ingevoerd in de invoervelden (zoals € of $).

 

Als er geen invoerregels, standaarden, of achteraf transformaties zijn ingebouwd, kan het verschil van het correct ophalen van de verkoopcijfers een enorme uitdaging zijn. Het uitzoeken wat er ingevuld had moeten zijn en het repareren ervan kost een hoop tijd en geld.  

 

Het op orde hebben van je datakwaliteit geeft vertrouwen, zodat je zeker weet dat wat je ziet de waarheid is en iedereen kan vertrouwen op de data. Als medewerkers niet kunnen vertrouwen op de data merk je dat ze zelf zaken gaan bijhouden in individuele Excel-sheets en daarmee is het overzicht kwijt.

 

Wat kun je doen om de datakwaliteit te verbeteren?

  • Bespreken van standaarden voor de data invoer;
  • Actief valideren of de ingevoerde data is zoals afgesproken;
  • Achteraf transformeren van data voor een correcte representatie;
  • Actief controleren op dubbele waardes;
  • Iemand in de organisatie aanstellen die verantwoordelijk is voor de data.

 

Wil je ook betrouwbare rapportage op basis van een goede datakwaliteit?
Wij helpen jouw organisatie graag verder. Bel ons op: 020 - 655 75 75 of vul het onderstaande formulier in.

 

Bronnen:
https://dama.org/
DAMA  - 6 Dimensies van Datakwaliteit



Gepost door Ralph Bos

Je reactie is welkom

Typ bovenstaande code over.
www.qube.nl gebruikt cookies om de website te verbeteren en te analyseren, voor social media en om ervoor te zorgen dat je relevante advertenties te zien krijgt. Als je meer wilt weten over deze cookies, klik dan hier voor ons cookie beleid. Bij akkoord geef je www.qube.nl toestemming voor het gebruik van cookies op onze website.
 Cookies NIET accepteren