Van datachaos naar datakwaliteit

Van datachaos naar datakwaliteit

In één uur tijd veranderen alleen al in de Verenigde Staten 240 bedrijven van adres, 150 bedrijven van telefoonnummer en openen 12 ondernemingen haar deuren. De immense snelheid waarmee data verandert resulteert in onbetrouwbare data. Het Trendonderzoek 2013 toont aan dat 93% van de CFO’s prioriteit belang hecht aan het betrouwbaarder maken van data, echter slechts 72% zegt dat het betrouwbaarder maken van data ook effectief wordt gerealiseerd. Ondanks de hoge prioriteit blijft de daadkracht achter. Op welke manier kan er een stap worden gezet in het verhogen van deze effectiviteit richting betrouwbare data?

Data funnel

Datakwaliteit wordt gedefinieerd als de mate waarin data geschikt is voor het doel waarvoor het gebruikt wordt. Vanuit dat oogpunt moet het dus een geschikte informatiebron en graadmeter zijn voor operationele, financiële en strategische beslissingen. Om hieraan te voldoen is het belangrijk dat de data tijdig aanwezig is, maar ook dat het compleet, accuraat en consistent is. Daarnaast speelt de begrijpbaarheid van data een cruciale rol in rapportagesystemen. Vaak zijn de definities niet helder omschreven en wordt het nemen van beslissingen op basis van geproduceerde rapporten risicovoller. Met andere woorden, om inzicht te verkrijgen in de huidige datakwaliteit dient tevens het achterliggende proces te worden doorgrond.

Meest voorkomende oorzaken

De hoeveelheid data, de diversiteit van de data en de snelheid waarmee de data binnenkomt en opgevraagd wordt is de afgelopen jaren enorm toegenomen. Daarnaast is één van de meest voorkomende oorzaken van slechte datakwaliteit het feit dat databases niet leeg zijn bij het begin van het gebruik. Nieuwe databases worden gevoed met bron-data die met behulp van een conversietool zodanig is aangepast, dat de data in het juiste formaat in de nieuwe database worden geladen. Daarnaast zijn consolidaties van databases zeer gebruikelijk in het IT-landschap, wanneer er voor oude IT-systemen geen ondersteuning meer wordt gegeven of deze worden gecombineerd met nieuwere IT-systemen. Ook overnames vormen, vanwege de korte tijdspanne en samenvoeging van verschillende culturen en departementen, een potentieel risico voor de datakwaliteit en daarmee de betrouwbaarheid. Tevens moet het manueel toevoegen of bewerken van data niet worden onderschat. Niet zelden vormt een combinatie van bovenstaande oorzaak een ware datachaos. De noodzaak om data te managen is groot, om zo de consequenties van slechte datakwaliteit te reduceren.

Impact van slechte datakwaliteit

Het gevolg van slechte datakwaliteit wordt al snel duidelijk in het dagelijkse leven. Het ontvangen van auto-replies van niet bestaande of incorrecte emailadressen is een frustrerend feit, wanneer je iemand gericht probeert te bereiken. Op grotere schaal heeft onbetrouwbare data een serieuze impact op de operationele bedrijfsvoering van een onderneming. Voor de commerciële afdeling zijn klantgegevens van groot belang. Marketinginspanningen op basis van vervuilde klantdata zullen de potentie van de marketingcampagne significant doen afnemen. Vanuit financieel perspectief is betrouwbare data eveneens van groot belang, om de juistheid, compleetheid en accuraatheid van het rapportagesysteem te kunnen garanderen en de onderneming de juiste richting in te kunnen sturen.

Op grotere schaal heeft onbetrouwbare data een serieuze impact op de operationele bedrijfsvoering van een onderneming.

Inzicht krijgen met behulp van Data Quality tools

Gezien de impact van onbetrouwbare data op de onderneming, is de hoofdvraag hoe de betrouwbaarheid van data significant kan worden verbeterd en onderhouden. Naast het doorlopen van het gehele proces waarin data wordt verzameld, behandeld en opgeslagen, kunnen Data Quality Tools, zoals Oracle Enterprise Data Quality (EDQ), uitkomst bieden om de kwaliteit een positieve boost te geven. Deze tools kunnen inzicht geven in hoeverre de data daadwerkelijk van slechte kwaliteit is.

Dergelijke tools bieden handvatten om te beoordelen hoe accuraat de datasets zijn, of de datasets compleet zijn, maar bijvoorbeeld ook om te ontdekken of de huidige masterdata nog wel voldoet. Het kan worden gebruikt als startpunt bij datamanagementproblemen en -verbeteringen. Middels deze tools kan een flinke stap richting een hogere effectiviteit van de betrouwbaarheid van data worden gezet. Je weet immers specifiek wat er mankeert aan de huidige data, wat mogelijkheden biedt om het proces waarop data wordt verkregen te optimaliseren.

Samengevat

Het dynamische karakter en de grote hoeveelheid van aanwezige data vraagt om aandacht.  De invloed van datakwaliteit is merkbaar door de gehele onderneming. Inzicht in de huidige datakwaliteit blijft achter, alsmede het betrouwbaarder maken van de data. Een correlatie tussen beide is waarneembaar binnen veel organisaties. Data Quality tools bieden inzicht in datakwaliteit en geven het startschot voor het verbeteren van dataprocessen.

 

Governance, Risk & Compliance Oracle EPM