De voor- en nadelen van Big Data

Door: Jasper Bakker | 30 juli 2015 13:07

Algemeen

Inhoudsopgave

  1. Inleiding
  2. pagina 2
  3. pagina 3

Big Data is in de hoofden van marketeers een warme droom, in de ogen van verkopers een veelbelovend middel voor hun salestargets, en in de perceptie van veel consumenten een groot gevaar voor je privacy. Tegelijkertijd belooft Big Data jou ook veel voordelen. Voor welke prijs?

Het is een streven van veel goedbedoelende nerds om gegevens toegankelijk te maken. De overtuiging dat informatie vrij wil zijn, is een bekend gegeven uit de hackerswereld. De één vult dat in met de interpretatie dat het oké is om digitale data te kopiëren, de ander werkt aan het zo breed mogelijk beschikbaar stellen van allerlei informatiebronnen. Ingenieurs bij Google hebben al openlijk gesteld dat dát het doel is van die zoekmachine: de data van de wereld ontsluiten. Lees ook: 6 'tastbare' big data-projecten.

Zoektermen automatisch aanvullen

Het simpelweg kopiëren of openbaar maken van gegevens is één ding. Het op allerlei manieren koppelen, combineren en analyseren van gegevens is een heel ander ding. Dat kan namelijk nieuwe inzichten opleveren waarop mensen, organisaties, bedrijven en overheden beter onderbouwde beslissingen kunnen nemen. Google doet dat voor gewone gebruikers door bijvoorbeeld zoektermen actief en live aan te vullen wanneer mensen iets intikken in de veelgebruikte zoekmachine.

Daarnaast werkt Google verder door met de dienst Google Now. Deze intelligente persoonlijke assistent combineert diverse databronnen, zoals je agenda en openbare verkeersinformatie, om je bijvoorbeeld te waarschuwen dat je voor een afspraak om 15:00 uur nú moet vertrekken omdat er op je route file aan het ontstaan is. De door Google overgenomen navigatie-app Waze zorgt weer voor een nieuwe bron van verkeersinformatie: opgebouwd uit de bewegingssnelheid - of juist stilstand in een file - van de vele Waze-gebruikers. Terwijl je agenda een privé-item is, geldt dat niet voor grootschalig vergaarde en daarbij geanonimiseerde informatie zoals verkeersstromen.

Definitie(s)

Een veelzeggend spreekwoord in de ICT luidt als volgt: Het mooie aan standaarden is dat je er altijd meerdere van hebt. Hetzelfde valt te zeggen voor definities van technologieën, zeker als die een mooi marketinglabel hebben gekregen. Big Data ontkomt hier ook niet aan. Van oorsprong is Big Data gedefinieerd als 'data van zeer grote omvang, waarbij het gebruik en beheer ervan aanzienlijke logistieke uitdagingen met zich meebrengt'. Dit is een ietwat vage omschrijving, die haaks staat op het huidige groeiende gebruik van Big Data door veel bedrijven, organisaties en overheidsorganen.

Op deze definitie is een variant gekomen die erkent dat de term veelomvattend is en van toepassing is op 'elke verzameling datasets die zo groot en complex is dat het moeilijk te verwerken is met beschikbare tools voor databeheer of met traditionele programma's voor dataverwerking'. Ook deze definitie bevat subjectieve woorden die een bepaalde houdbaarheid hebben. Want wat is moeilijk, en waar ligt de grens tussen traditionele en niet-traditionele programma's?

Gaandeweg de acceptatie, populariteit en ingebruikname van Big Data, zijn er dan ook andere definities geformuleerd. Zoals 'het gebruik van informatie op vernieuwende manieren om nuttige inzichten of goederen of diensten met aanzienlijke waarde te produceren'. Nog altijd behoorlijk breed te interpreteren, maar de focus ligt niet meer zozeer op de omvang van de dataverzameling maar op het nut ervan. Een valkuil is namelijk de gedachte dat alsmaar meer informatie vanzelf leidt tot antwoorden en inzichten. Verzamelwoede voor data kan juist leiden tot minder nuttige informatie. Big Data gaat om het vinden van de (gouden) speld in de hooiberg, die is opgebouwd uit andere hooibergen.

Bier en luiers

Big Data is de term voor dergelijke grootschalige verzameling, koppeling, combinatie, analyse en interpretatie van informatie. Die informatie komt dan uit diverse bronnen en bestaat uit diverse formaten. Het doel van de combinatie en analyse is het verkrijgen van nieuwe inzichten. Soms kunnen dat best verrassende inzichten zijn. Het zogeheten bier-pamperssyndroom is een bekend voorbeeld daarvan, hoewel het waarheidsgehalte ervan wordt betwist. Kort gezegd komt het bier-pamperssyndroom erop neer dat een Amerikaanse supermarktketen jaren geleden uit de analyse van verkoopgegevens een vreemde correlatie haalde. Te weten die tussen de verkoop van bier en die van luiers, met name op vrijdagavond en/of zaterdag. Deze twee volledig verschillende producten hadden iets met elkaar gemeen, want ze werden redelijk simultaan met elkaar verkocht.

Grappen over ouderschap en drankbehoefte daargelaten, leek er toch echt een link te zijn tussen luiers en bier. De redenatie was dat kersverse moeders hun partners op pad stuurden om de grote, onhandige pakken met luiers te halen en dat mannen er dan naar neigden om dan maar nog een groot product mee te nemen: een kratje bier. Als eigen beloning voor het boodschappenwerk? Vervolgens zou de Amerikaanse supermarkt de winkelpositie van luiers en bier hebben aangepast zodat de twee dichter bij elkaar lagen en meer op één route naar de kassa's. Resultaat? De verkoop van bier schoot omhoog. Tenminste, dat wil de overlevering, want details en oorsprong van dit dataverhaal ontbreken. Dus een broodjeaapverhaal? Toch is het een nuttige anekdote als voorbeeld van de voordelen die data-analyse kan brengen.

Inschatting, inkoop, korting en gratis

De klantenkaarten die vele Nederlanders hebben, brengen hun koopgedrag in kaart. Dit niet om hun drankgewoonten bloot te leggen of om met gerichte advertenties aan te zetten tot meer drankinkoop. Het gaat supermarkten, winkeliers en andere aanbieders er ook om betere inkoop te kunnen doen, zodat hun klanten niet onverwacht voor lege schappen staan. En natuurlijk ook zodat de aanbieders niet met onverkochte - en schijnbaar onverkoopbare - voorraden blijven zitten. Als beloning krijgen klanten dan vaak voordeeltjes: extra korting op bepaalde producten of diensten.

In het moderne tijdperk van Big Data kan de korting ook heel ver gaan. Complete producten en diensten zijn geheel gratis. Klinkt wat vergezocht? Dat is het absoluut niet. De kosten voor de opslag van petabytes aan data, de rekenkracht van vele honderdduizenden servers en de enorme hoeveelheden netwerkverkeer zijn vaak niet voor rekening van de gebruiker. Google is gratis te gebruiken, Facebook ook. Googles mobiele besturingssysteem Android is gratis voor de makers van smartphones en tablets. Dit zijn allemaal middelen om meer en meer data te verzamelen.