Het thema Big Data krijgt de laatste tijd veel aandacht. Bijna dagelijks vindt men wel een kort artikel in de managementbladen. Het belang wordt zo groot geacht, dat Big Data hoofdletters krijgt toebedeeld. Wat desalniettemin opvalt is dat in weinig publicaties duidelijk wordt wat onder Big Data wordt verstaan. Forbes komt zelfs met 12 uiteenlopende definities. Met onduidelijkheid over terminologie zal snel verwarring ontstaan in discussies over Big Data.
De definities zijn op te splitsen in 3 subgroepen: ‘Big Data zijn veel gegevens’, ‘Big Data zijn ook de analytische technieken’ en ‘Big Data zijn ook data toepassingen’. Wat zijn de verschillen, overeenkomsten en spraakverwarringen?
1. Big Data zijn veel gegevens
In de pure vertaling betekent Big Data enkel de verzameling van veel gegevens. In deze terminologie kan nog niet worden gezegd wat de meerwaarde van Big Data is. Wanneer de gegevens ongestructureerd opgeslagen, niet kwantificeerbaar, of niet aan een relevante onderzoeksvraag verbonden zijn, is de zin van Big Data in de puurste vertaling nog ver te zoeken.
2. Big Data zijn ook de analytische technieken
Een meer uitgebreide definitie omvat ook de analytische technieken die los gelaten kunnen worden op Big Data. Structurering, kwantificeerbaarheid en de onderzoeksvraag zijn hiervoor allereerst van belang. In deze definitie is Big Data dan ook meer begrensd als ‘verzameling van gegevens waar ook daadwerkelijk data analytics op kan worden toegepast’. De hedendaagse mogelijkheid tot structureel opslaan van gegevens maakt dat data van meer en meer bedrijven binnen deze Big Data definitie valt.
3. Big Data zijn ook data toepassingen
Een vergaande definitie van Big Data neemt ook de toepassingen mee. Welke inzichten een direct gevolg zijn van de beschikbaarheid van gegevens is hierin onderdeel van het Big Data domein. Kwantitatieve bedrijfsbeslissingen, aan de hand van klantgegevens of logistieke historie en analytische technieken, behoren tot deze definities in de breedste zin. Hier wordt dan ook niet meer getwijfeld aan de zin of onzin van Big Data: de meerwaarde is reeds als zo hoog ingeschat, dat de toepassing ervan is gekozen.
Spraakverwarringen ontstaan wanneer persoon X slechts over definitie 1 praat om aan te geven dat zijn bedrijf Big Data heeft, terwijl persoon Y veronderstelt dat persoon X er ook allerlei bedrijfsbeslissingen vanaf laat hangen. Het is daarom zeer wezenlijk van elkaar te weten welke definitie gehanteerd wordt. Eensgezindheid over de definitie zal niet snel ontstaan: bekend zijn met de mogelijke verschillende invalshoeken is daarom van groot belang!
Toch zou enige consensus in deze definitiekwestie gewenst zijn. Naar het oer-Hollandse poldermodel is het de vraag of de 3 subgroepen zich in 1 definitie kunnen vinden. Binnen Erasmus Q-Intelligence gaan we uit van de volgende definitie, welke op te knippen is in de 3 genoemde subgroepen:
“Big Data is de grote hoeveelheid gegevens waaruit met analytische vaardigheden inzichten kunnen worden gedestilleerd die waardevol zijn voor bedrijfsstrategieën en –beslissingen.”
Uitgaande van bovenstaande definitie kan de vervolgvraag niet uitblijven: Hoe kan Big Data; definitie 1 voor uw praktijk Big Data; definitie 2 worden? Daarover meer in volgende publicaties van Erasmus Q-Intelligence.