Big data is het modewoord van het moment. Dat bleek eens te meer tijdens het recente Business Meets IT-seminarie met praktische tips, cijfers en anekdotes over big data.


Big data is het modewoord van het moment. Dat bleek eens te meer tijdens het recente Business Meets IT-seminarie met praktische tips, cijfers en anekdotes over big data. Zoals over dat bedrijf dat erin was geslaagd om de zwangerschap van een tienermeisje te voorspellen, nog voor haar vader daar van op de hoogte was.

Met 130 à 140 aanwezigen op het BMIT-seminar zat de zaal goed vol en sneuvelde zelfs het deelnemersrecord. Big data kan dan ook een belangrijke impact hebben op uw bedrijf. Verschillende studies spreken in het voordeel van een data gedreven aanpak, maar dan moet u wel over de juiste tools en expertise beschikken om die data te verwerken. Het doel is uiteindelijk om te evolueren naar een beslissingsmakingsproces dat (gedeeltelijk) wordt gedreven door data in plaats van intuïtie.


Het voorbeeld bij uitstek van een organisatie met zo’n aanpak is Google. Elke beslissing, op eender welk niveau, wordt bij de internetreus pas genomen na analyse van beschikbare data. Niets wordt aan het toeval overgelaten. Ook bij de Amerikaanse supermarktketen Wal-Mart wordt big data hoog aangeschreven en zetelt er een dataspecialist in de wekelijkse directievergadering. Om maar te zeggen dat big data doordringt in alle sectoren.

Automatisering

Het grote voordeel van een door data gedreven aanpak is dat u na verloop van tijd bepaalde processen kunt automatiseren. Dat gaat heel ver. Een bekend voorbeeld is dat van de Amerikaanse winkelketen Target, dat op basis van het aankoopgedrag van zijn klanten wou proberen voorspellen wanneer iemand zwanger is, om vervolgens gerichte advertenties te sturen.

Het voorbeeld kwam onder de aandacht omdat Target erin was geslaagd om de zwangerschap van een tienermeisje te voorspellen, nog voor haar vader daar van op de hoogte was. Tot er ineens reclame voor babyspulletjes in de brievenbus belandde die was geadresseerd aan zijn dochter.

Big data kan dus een belangrijke impact hebben op de werking van uw bedrijf, maar wat is er nodig om uw bedrijf te transformeren naar een bedrijf dat gedreven wordt door big data? “Een goede data gedreven organisatie is een organisatie waar iedereen, ongeacht het niveau, toegang heeft tot die data en ermee kan experimenteren”, zegt Geert Van Landeghem, Managing Director bij consultancybureau DataCrunchers.

Vaak worden binnen een bedrijf verschillende datasets bijgehouden die niet gelinkt zijn aan elkaar of tussen afdelingen worden gedeeld. Daar knelt volgens Van Landeghem het schoentje. Toch moet daar nog een kleine kanttekening bij worden gemaakt. Het is in vele gevallen beter om eerst met small data aan de slag te gaan om uw ideeën te verifiëren, alvorens uw analyses op de hele dataset los te laten.

Orde in de chaos

Big data kan dus een belangrijke rol spelen in het sturen van uw beslissingsproces, maar dan moet u wel eerst inzicht krijgen in de grote hoeveelheid gegevens die binnen uw bedrijf wordt bewaard. De visualisatie van uw data kan daarin een belangrijke rol spelen.

“Veel bedrijven investeren vandaag alleen in opslag en verwerking, maar verrijking en visualisatie zijn veel interessanter om tot nieuwe inzichten te komen”, zegt Davy Suvee. Hij is Big Data Architect bij Datablend en heeft met name ervaring met het in beeld brengen van big data in de medische en farmaceutische sector. In deze sectoren wordt met erg complexe en vooral ook grote datasets gewerkt. Het verwerken van die gegevens gebeurt nu nog vaak manueel met behulp van macroscripts om inzichten te vergaren. Dat is een zeer kostelijk en weinig flexibel proces.

“Het is belangrijk om snel tot inzichten te komen, zelfs wanneer die nog niet de hele waarheid vertellen”, aldus Suvee. Door big data te visualiseren, duiken er patronen op die een computer misschien niet herkent, maar die het menselijk brein wel kan onderscheiden. “Het vinden van de naald in een hooiberg wordt eenvoudiger gemaakt. Dat is het vertrekpunt om nieuwe berekeningen te maken en tot nieuwe inzichten te komen”, besluit Suvee.

Ook bij Knowbel EarlyTracks proberen ze orde in de chaos van big data te scheppen. Deze spin-off van de Université Catholique de Louvain werkt rond text mining en data retrieval. Concreet gaat het om de extractie, structurering en verwerking van informatie die zich in grote hoeveelheden tekst bevindt.

“Onze tool kan informatie zoals thema’s, onderwerpen en relaties uit teksten filteren en creëert events die deze informatie met elkaar verbinden en categoriseren”, vertelt Patrick Watrin van Knowbel EarlyTracks. Op die manier kunnen teksten automatisch geanalyseerd worden en kan uitsluitend de informatie die relevant is voor de gebruiker uit de tekst gefilterd worden.

Privacy

Het zal u ondertussen al wel duidelijk zijn dat big data een belangrijke troef kan zijn voor uw bedrijf, maar hoe zit het met de privacy wanneer u gegevens van klanten verwerkt? Het eerdergenoemde voorbeeld van Target, waarin een zwangerschap met behulp van big data wordt voorspeld, deed u misschien de wenkbrauwen al even fronsen.

Ook het recente nieuws dat BNP Paribas Fortis en ING overwegen om de bankgegevens van hun klanten door te verkopen, stootte op heel wat kritiek. Om maar te zwijgen van internetdiensten als Google en Facebook die het hele online leven van hun gebruikers registreren om profielen op te stellen die ze kunnen doorverkopen aan adverteerders.

Tijdens het Business Meets IT-seminarie kwam Nicholas Braem, een consultant die momenteel werkzaam is bij een start-up in Silicon Valley, vertellen over een project dat hij heeft geleid bij een grote Europese telecomoperator.

Die operator wou de locatie- en datagegevens van zijn klanten visualiseren om daaruit inzichten te genereren en die vervolgens door te verkopen. Daarbij moest de privacy van de klanten wel gegarandeerd zijn. De gegevens werden daarom allemaal geanonimiseerd, zodat niemand individueel geïdentificeerd kan worden. Dat bleek echter nog niet voldoende om aan de strenge Duitse privacywetgeving te voldoen. “Duitse gebruikersgegevens mogen alleen beheerd worden door Duitse systeembeheerders”, vertelt Braem. “Dat maakte het onmogelijk om het project in Duitsland verder te zetten.” Braem adviseert dan ook om vanaf het begin een team met juristen te betrekken bij dergelijke projecten.

De drie V’s in big data

Big data is een veelomvattend begrip dat een brede lading dekt. Wilt u binnen uw bedrijf met big data aan de slag gaan, dan moet u rekeninghouden met volgende drie factoren:

Volume. Wie big data zegt, denkt in de eerste plaats aan een almaar groeiende hoeveelheid gegevens. De meeste bedrijven investeren daarom vooral in opslag en beheer van data.

Velocity. Big data draait ook om snelheid. Al die gegevens brengen pas op wanneer u ze ook snel kunt verwerken om voorspellende modellen te bouwen. Zo zou u bijvoorbeeld in real-time kunnen voorspellen wanneer een machine in panne gaat vallen.

Variety. Big data betekent ten slotte ook een grotere diversiteit aan documenten die verwerkt worden, zowel gestructureerd als ongestructureerd. Relationele databanken schieten vaak te kort, waardoor u naar andere oplossingen op zoek moet gaan.