Het recente interview van directeur Particulieren Hans Hagenaars van de ING met het FD over het Big Data plan heeft de gemoede- ren goed bezig gehouden. Hij bracht dit plan zodanig dat iedereen wel moest denken dat de ING zijn klanten zou uitleveren aan gehaaide commerciële jongens, en daarmee zou het gedaan zijn met de privacy.
Het fenomeen Big Data komt hiermee meteen in een verdacht hoekje, en over een tijdje zal het daarom wel een andere naam gaan krijgen.
Big Data is echter helemaal niet zo nieuw als het lijkt en bestaat feitelijk al heel lang. Econometristen zijn al vele jaren bezig om uit een veelheid van gegevens nuttige informatie te halen. Sinds het bestaan van klantenpassen, call centers en pinpassen wordt er informatie verzameld over klanten en die informatie wordt handzaam samengevat opdat bedrijven daar iets mee kunnen doen. Er zijn ook al lang bedrijven die postcodes in Nederland koppelen aan het type mensen dat daar woont, en andere bedrijven kunnen die postcodes met profielen weer kopen om daarmee doelgericht reclamefolders te versturen. Op die manier krijgen u en ik waarschijnlijk heel verschillend foldermateriaal in de brievenbus. De analyses van dat soort gegevens worden gedaan door data-analisten, en niet zelden hebben deze analisten econometrie gestudeerd.
Voor econometristen is Big Data dus eigenlijk weinig nieuws onder de zon. Hooguit zou je kunnen stellen dat door moderne sociale media en bedrijvigheid op het internet de data van vandaag misschien wat “bigger” zijn dan voorheen, maar het verschil tussen “veel” en “heel veel” is niet zo bijzonder, althans niet voor een econometrist.
Het idee achter Big Data is misschien het best te beschrijven aan de hand van een voorbeeld. Bedrijven als bol.com verkopen producten en ze houden bij wie die producten koopt. Albert Heijn kan dat ook met de klantenpashouders, maar niet met willekeurige klanten. Bol.com kan dat wel van iedereen, en wat ze er onder andere mee doen is het in kaart brengen van mensen die vergelijkbaar koopgedrag vertonen. Men weet echt niet of de klant een bril draagt, of een hond heeft (tenzij hij elke week een boek over honden koopt), maar bij bol.com kunnen ze wel een klantenprofiel van u maken. De klanthistories worden met elkaar vergeleken en als iemand in koopgedrag op u lijkt en die koopt het nieuwe boek van Tommy Wieringa, dan krijgt u wellicht de week er na een aanbieding van datzelfde boek. U lijkt immers op iemand, en wie weet heeft u inderdaad dezelfde interesse. Bol.com weet dat niet zeker, maar maakt als het ware een voorspelling van uw toekomstige koopgedrag. Als u nu dat boek koopt, leert bol.com weer meer van u als klant. Als u niet als een profiel door het leven wil gaan, moet u geen boeken kopen bij bol.com maar gewoon bij Donner in Rotterdam, waar ze u en uw klantgedrag niet kennen.
Voor econometristen geeft Big Data dus de mogelijkheid om niet waargenomen intenties te voorspellen, waarbij het kernwoord “niet waargenomen” is. Er zijn nog meer interessante fenomenen die niet precies worden waargenomen, maar wel voorspeld kunnen worden. Voorbeelden zijn “tevredenheid” (zoals blijkt uit uw werkelijke aankoopgedrag), “overweging” (u kent 50 automerken maar u overweegt er maar 4), “loyaliteit” (u zegt het niet alleen, u bent het ook), en “opmerkzaamheid” (kijkt u überhaupt wel naar reclames, of vergelijkt u eigenlijk echt wel prijzen met elkaar?). Doordat Big Data met zoveel is, is het voor econometristen mogelijk om die niet waargenomen variabelen in te schatten. Dat gaat niet met erg eenvoudige modellen, en het kost ook wel wat rekentijd, maar het kan wel. Dankzij die grote datasets maakt het vakgebied een flinke ontwikkeling door en biedt het geweldige uitdagingen voor studenten en wetenschappers.
De vraag is natuurlijk nu hoe Big Data zich verhoudt tot uw privacy. Econometristen maken alleen maar voorspellingen, en die zijn nooit honderd procent zeker. U zul ook vast wel eens totaal onverwachte aanbiedingen krijgen, waarmee een voorspelling er dus behoorlijk naast zat. De discussie over privacy zal echter eerder plaats moeten hebben over wat er aan het begin van de keten gebeurt. Het spoor dat u achterlaat op internet, via uw telefoon, of via uw pinpasje, daar begint het allemaal mee.
- CV
Philip Hans Franses is hoogleraar toegepaste econometrie en hoogleraar marketing research aan de Erasmus School of Economics. Hij is hier sinds 1987 werkzaam en staat sinds jaar en dag hoog genoteerd in rankings van Nederlandse economen. Sinds september 2006 is Franses tevens decaan van de Erasmus School of Economics.