Inleiding
Artificiële intelligentie zal wellicht uitgroeien tot een van de belangrijkste sectoren van deze eeuw!
1.8
Big Data
Men spreekt van Big Data wanneer men werkt met meerdere datasets die te groot zijn om met reguliere databasemanagementsystemen verwerkt te worden. Hierbij zijn drie factoren belangrijk: de hoeveelheid data, de snelheid waarmee de data binnenkomt en opgevraagd wordt en de diversiteit van de data. In het Engels spreekt men van de drie V’s: Volume (hoeveelheid data), Velocity (snelheid van verwerking) en Variety (diversiteit van gegevens). Soms wordt Value hieraan toegevoegd om het objectief, de (meer)waarde die dit kan opleveren, te benadrukken.
Zo wordt er gebruik gemaakt van zowel gestructureerde data (uit databanken) als van ongestructureerde data van bijvoorbeeld sociale netwerken (tweets, blogs, forums, audio, video, webpagina’s, geografische info,…). In tweets bijvoorbeeld zit er weinig structuur : er is de zender en de datum en verder 140 willekeurige tekens met veel verschillende hashtags. De beschikbaarheid van grote hoeveelheden big data wordt veroorzaakt door een aantal elementen:
Het intensief gebruik van mediatoepassingen zoals streamingdiensten, sociale media, …. Dat veroorzaakt een stroom aan berichten, foto’s, filmpjes, … Dit is een gigantische stroom ongestructureerde gegevens.
De gigantische hoeveelheid gegevens die via het web verspreid worden, dragen ook bij tot de steeds grotere beschikbaarheid van big data: webshops, wikipedia, blogs, discussiefora, enzovoort.
IoT, the internet of things. Dat begrip leggen we wat verder in detail uit. Hier krijgen we gestructureerde gegevens die in een hoog tempo door allerlei apparaten gegenereerd worden.
Database Concepts
17