Data-analyse en -beheer: vriend of vijand?
Tim Bottelbergs, Partner BDO Digital
Steven Cauwenberghs, Partner BDO Risk Advisory
Walter Vanherle, Partner BDO Digital
Elke organisatie produceert data. Maar niet iedereen doet er ook actief iets mee. Toch kan die goudmijn aan informatie het kompas zijn dat je organisatie nodig heeft om te navigeren in het steeds digitaler wordende bedrijfslandschap. Goede data-analyses en -beheer zijn daarbij onmisbaar. Hoe? De vraag stellen, is ze beantwoorden.
Ik sta aan het begin van mijn data-analysetraject. Waarmee start ik het beste?
Je hoeft niet meteen de grote trukendoos open te trekken. Begin gerust klein en verfijn gaandeweg. Start bijvoorbeeld met data uit operationele systemen te centraliseren in een datawarehouse. Hierop kunnen rapporten en dashboards worden gebouwd om eerste inzichten te verkrijgen. Belangrijk, waak vanaf dag één over datakwaliteit, -privacy en -veiligheid. Zorg er dus voor dat de data wordt gedocumenteerd en dat duidelijk is hoe deze gegevens worden verwerkt alvorens erover te rapporteren. Naarmate je vordert, kun je in de vorm van ‘proof of concepts’ experimenteren met allerlei datawetenschapstechnieken en machinelearning-modellen om steeds dieper inzicht te krijgen in je bedrijf én de waarde van je data. Die inzichten kun je dan operationeel inzetten in processen om je personeel (eventueel via Robotic Process Automation – lees ook onze gratis whitepaper ‘Robotic Process Automation‘) te ondersteunen in hun dagelijkse takenpakket.
Zijn data-analyses duur?
Een data-analyseproject hoeft geen handenvol geld te kosten. Zo kun je data centraliseren in een cloudoplossing waarbij je enkel betaalt voor wat je effectief verbruikt, zowel qua opslag als de benodigde tools om data te extraheren uit operationele systemen en te transformeren. Bovendien zitten veel analyse- en visualisatietechnieken al ingebouwd in open sourcetools, zoals PowerBI of Python.
Moet ik ‘deep learning’-experts aan boord halen om data-analyses uit te voeren?
Grote bedrijven zoals Google, Facebook en Uber zetten in op ‘top shelf’-modellen, zoals neurale (‘deep learning’) netwerken. Toch zijn er ook minder complexe modellen op de markt die niet vereisen dat je alle kennis van deze algoritmes in huis hebt. Met lineaire regressie en beslissingsbomen kom je vaak al een heel eind. Toch nood aan meer geavanceerde technieken? Dan zijn deze oplossingen vaak kant-en-klaar in te roepen via een API (Application Programming Interface), al dan niet tegen betaling. Zie je het grootster en wil je bijvoorbeeld machinelearning-modellen trainen en onderhouden, dan win je best het advies in van gespecialiseerde partijen.
Waarom wordt datakwaliteit steeds belangrijker?
Naarmate je meer data-analyses inzet, zal de uitkomst van visualisaties en modellen steeds vaker worden gebruikt als basis voor bedrijfsbeslissingen. Het is dan ook essentieel dat wat in deze dashboards en rapporten wordt getoond, correct en accuraat is. Documenteer ook hoe de informatie moet worden geïnterpreteerd en waar ze vandaan komt om foutieve uitkomsten te vermijden.
Hoe ga ik om met dataprivacy?
Vraag altijd de expliciete toestemming van de persoon alvorens gegevens op te slaan. Inventariseer alle persoonsgegevens die worden verwerkt binnen de organisatie en verifieer of ze gerechtvaardigd zijn. Bewaar en verwerk daarbij alleen de data die nodig zijn en anonimiseer zoveel mogelijk persoonsgegevens om de impact van mogelijke datalekken te beperken. Data is waardevol, beveilig ze dan ook alsof ze jouw dierbaarste bezit zijn. Mocht er toch data lekken, breng de betrokken personen hiervan dan op de hoogte. Maak ten slotte je werknemers bewust van het belang van dataprivacy en cybersecurity door regelmatig o.a. zelf phishingcampagnes te organiseren waarbij je hen wijst op de gevaren van frauduleuze mails.
Hoe haal ik het meeste uit een machinelearning-algoritme?
Een kosten-batenanalyse geeft inzicht in verschillende scenario’s met een gedetailleerde meerjaren- of kwartaaltijdsas, de verwachte kosten en opbrengsten, en de risico’s en verwachtingen. De kosten omvatten: de tijd van je eigen en eventueel externe medewerkers omgezet in euro’s, en de IT-kosten, zoals infrastructuur en software. Die geef je weer als eenmalige of weerkerende kosten. De opbrengsten worden uitgedrukt in zgn. Financial Impact Templates (FIT) die de besparingen, tijd in euro’s en hogere opbrengsten voor elk proces inschatten alsook de impact in tijd, uitgedrukt in procenten. De FIT’s duiden ook de verwachte realisaties aan die je moet opvolgen.
Is de IT-afdeling verantwoordelijk voor databeheer?
IT is niet alleen verantwoordelijk. Iedereen in de organisatie moet zich bewuster worden van hoe het bedrijf omgaat met data, de impact ervan en hoe die moet worden geïnterpreteerd. Van input over verwerking tot output. Je moet de juiste processen in stelling brengen, ingebed in een databeleid, al dan niet gemonitord door een Data Privacy Officer. Deze laatste geeft bovendien aan wat kan en wat niet inzake datakwaliteit, -privacy, enz.
Vragen over databeheer?
Zoek je hulp bij de analyse van je situatie? Neem contact op met onze specialisten: tim.bottelbergs@bdo.be, steven.cauwenberghs@bdo.be of walter.vanherle@bdo.be
Lees ook onze whitepaper ‘From waste to fuel – take data-driven decisions with AI and Machine Learning’ (Engels)