Vorig jaar publiceerde The Economist een artikel getiteld “Big Data - Crunching the Numbers”. Het artikel in The Economist bespreekt de kansen die Big Data biedt voor het bankwezen, alsmede de potentie om de klant-bankrelaties te hervormen. Het kunnen analyseren van de enorme hoeveelheid aan dagelijks gepubliceerde data van verscheidene klanten en bronnen, zou het managen van zelfs de grootste risico’s behapbaar kunnen maken.
Bovendien stelt het banken in staat om het aantal klanten te verhogen en om meer, betere, en toegesneden diensten te bieden. Echter, indien de grote banken zichzelf niet opnieuw uitvinden in de context van Big Data, riskeren ze snel terrein te verliezen aan websites die bemiddelen tussen klanten en banken. Verscheidene uitdagingen, zoals schaalbaarheid, beveiliging en privacy moeten worden opgelost voordat Big Data maximaal benut kan worden.
Big Data is een populaire term die momenteel vaak wordt gebruikt om de enorme hoeveelheid aan beschikbare data (terabytes, petabytes, of zelfs exabytes) uit te drukken die onmogelijk te verwerken is met behulp van traditionele datamanagementtechnieken. Al in 2001 associeerde Douglas Laney (analist bij Gartner) Big Data met de drie kenmerkende eigenschappen bekend als de drie V’s: volume (groeiende hoeveelheid data), vlugheid (snelheid van nieuw binnenkomende data) en variatie (verscheidenheid in datavormen). Volgens IBM produceren mensen 2.5 exabytes per dag en 90% van de data die vandaag de dag bestaat is slechts gegenereerd in de afgelopen twee jaar. Deze enorme hoeveelheid aan data heeft nieuwe opslag-, transmissie-, en verwerkingscapaciteiten nodig om nuttig te zijn voor verscheidene economische sectoren, zoals het bankwezen.
Vorig jaar nam Citigroup Watson, de beroemde IBM computer die de menselijke kampioenen in de Amerikaanse quiz “Jeopardy” moeiteloos versloeg, in dienst. Belangrijkste reden? De redeneerschema's en -mogelijkheden van Watson kunnen Citigroup helpen om hun risicoanalyses te maken, fraude te ontdekken, of financiële aanbiedingen op te stellen. Een ander voorbeeld is de internetbetalingsreus PayPal, die 2011 ternauwernood overleefde door toedoen van fraudeurs. Om deze externe dreigingen de baas te worden, ontwikkelde PayPal Igor, een computersysteem genoemd naar een Russische dief en hacker dat ongebruikelijke patronen analyseert in grote hoeveelheden data. Verschillende andere bedrijven zoals Palantir en Xoom volgden met het bouwen van systemen die data van uiteenlopende bronnen aggregeren en analyseren voor mogelijke connecties.
Wellicht de grootste afnemers van fraudebestrijdende computers zijn creditcardmaatschappijen als Visa en MasterCard. Hoewel voor het menselijk oog individuele betalingen legitiem lijken te zijn, kunnen computeranalyses van alle beschikbare transacties ongebruikelijke patronen of connecties ontdekken. Dergelijke systemen zijn nooit goedkoop, maar in verhouding tot de mogelijke verliezen door fraude (geschat op 0.1% van alle transacties) zijn de kosten bijzonder laag. Kleine banken die zich niet zulke systemen konden veroorloven hebben stuk voor stuk hun creditcarddiensten moeten opdoeken of moeten verkopen aan grote creditcardmaatschappijen die veel meer transacties tot hun beschikking hebben, en dus ook beter fraude kunnen detecteren. Toch zijn er steeds meer kleine bedrijven die zich realiseren dat, met behulp van grote (externe) databronnen en aangepaste technieken voor het analyseren van Big Data, creditcarddiensten in eigen beheer kunnen blijven.
De wijde beschikbaarheid van grote hoeveelheden data heeft voor nieuwe zakelijke mogelijkheden gezorgd. Bij het analyseren van winkelgedrag van klanten, kan Citigroup nu bijvoorbeeld tekstberichten sturen met kortingscodes voor winkels en restaurants, om zo extra transacties (en dus meer inkomen) bij de bank te genereren. Lloyds Banking Group overweegt op dit moment niet alleen een balans te tonen aan klanten, maar ook hoeveel geld er overblijft na het betalen van rekeningen. ZestCash maakt het mogelijk voor personen met een slechte krediethistorie om tóch geld te lenen, door te kijken naar duizenden indicatoren. Met een soortgelijke aanpak biedt Tesco nu creditcards en leningen door de kredietwaardigheid van klanten te toetsen op basis van hun winkelgewoonten. Tot slot brengen financiële adviseurs van Mint met behulp van een geaggregeerd overzicht van de financiële situatie van hun klanten advies uit.
Alle voorgenoemde voordelen van het gebruik van Big Data in het bankwezen gaan echter gepaard met de nodige risico’s. Banken kunnen bijvoorbeeld overbodig worden, wanneer genoeg informatie vrij toegankelijk is voor investeerders en spaarders. Andrew Haldane van de Bank of England is van mening dat na de muziek en uitgeverij, de financiële sector wel eens kan volgen in het schrappen van tussenpersonen. Privacy en beveiliging zorgen ook voor complicaties, aangezien klanten bang zijn de controle over hun gegevens te verliezen in de grote aggregatieprocessen. Zo werd Target, een Amerikaanse retailer, in 2012 bekritiseerd na het sturen van baby-gerelateerde coupons naar een tienermeisje op basis van een winkelgedraganalyse. Het meisje had haar familie nog niet ingelicht over haar zwangerschap, en hoefde dat ook niet meer te doen. Afgezien van deze problemen, zijn er ook uitdagingen wat betreft de schaalbaarheid van de technieken. Dit heeft niet alleen te maken met de grote hoeveelheid data die verwerkt moet worden, maar ook met het feit dat deze hoeveelheid alleen maar toeneemt. Dergelijke Big Data uitdagingen moeten grondig worden onderzocht door zowel academici als bedrijven, voordat volledig geprofiteerd kan worden van de voordelen van Big Data.
- CV
Flavius Frasincar is universitair docent economie & informatica aan de Erasmus School of Economics. Hij is verbonden aan het Econometrisch Instituut en het onderzoekscentrum voor Business Intelligence bij het Erasmus Research Institute of Management. Hij is lid van de editorial board van de International Journal of Web Engineering and Technology (IJWET). Hij doet onderzoek op het raakvlak van economie en informatica. In het bijzonder bestudeert hij de toepassing van informatiesystemen en kunstmatige intelligentie voor ontwikkeling van slimme beslissing ondersteuningssystemen.
Frederik Hogenboom is een promovendus aan de Erasmus School of Economics, verbonden aan het Econometrisch Instituut, Erasmus Studio, en het onderzoekscentrum voor Business Intelligence bij het Erasmus Research Institute of Management. In het kader van het NWO Exacte Wetenschappen Vrije Competitie project 612.001.009 “Financial Events Recognition in News for Algorithmic Trading” (FERNAT) en het FES COMMIT Infiniti project “Information Retrieval for Information Services” doet hij onderzoek op het gebied van intelligente systemen voor informatie-extractie, specifiek gericht op de extractie van financiële gebeurtenissen uit nieuws, toegepast in handelsalgoritmes.