Wat is Big Data?

Als jij een antwoord wil op de vraag “Wat is Big Data?”, dan ben je hier aan het juiste adres. Geen omslachtig gedoe, maar door een makkelijke uitleg weet je wat Big Data is. We beginnen met de betekenis van Big Data. Daarna gaan we kijken hoe Big Data analyse werkt. Aan de hand van Big Data voorbeelden krijg je een beter beeld over Big Data. Tot slot bespreken we de voor- en nadelen van Big Data en hoe je eventueel van Big Data je beroep kan maken. Lees lekker verder!

Big Data betekenis

Big Data is een grote hoeveelheid ongestructureerde en gestructureerde data. De hoeveelheid data is te groot om het te verwerken met traditionele software technieken en/of een database.

Maar wat is dan precies deze data? De data uit Big Data kan bestaan uit tekst, audio, video en afbeeldingen.

De hoeveelheid data is op zich niet zo belangrijk. Het gaat er meer om wat er met de data gedaan wordt en welke besluiten op basis van Big Data worden genomen.

Een data analist zou wel raad weten met Big Data en weet uit de chaos van die enorme hoeveelheden data waarde te creëren. Door Big Data te analyseren en er structuur in aan te brengen, kunnen er conclusies worden getrokken. Op basis van die conclusies kunnen er belangrijke besluiten worden genomen.

Big Data is een veel gebruikte term bij nieuwe technieken, zoals Machine Learning. Machine Learning en Big Data vormen een goede match. Machine Learning zorgt ervoor dat computers slimmer worden. Om computers slimmer te maken, is Big Data nodig. Uit deze data kan een slimme computer patronen ontdekken en slimmer worden.

Tegenwoordig worden er grote hoeveelheden Big Data verzameld. Google weet inmiddels al meer van je dan je eigen ouders. Dit komt door de verzameling van Big Data. We leven in een wereld van Big Data.

Hopelijk is de betekenis van Big Data duidelijker voor je. Nu kunnen we gaan kijken hoe Big Data analyse werkt en we kijken naar mooie voorbeelden van Big Data.

Big Data betekenis

Hoe werkt Big Data analyse?

Er zijn verschillende manieren om Big Data te analyseren. Hieronder zetten we een paar bekende methodes op een rijtje.

Data mining

Data mining is het ontdekken van bepaalde patronen in Big Data en verbanden kunnen leggen. Aan de hand van data mining kan er een voorspellende analyse worden gedaan, waar we het later in dit hoofdstuk over gaan hebben.

Stel dat een webshop wil weten wat voor producten klanten kopen en of dat een verband heeft met de leeftijd en geslacht van de klant. Dan kan dat met behulp van data mining.

Met Python of R zou je aan data mining kunnen doen.

Machine Learning

We hebben het er al even over gehad. Machine Learning zorgt ervoor dat computers slimmer worden. Doordat slimme computers goed Big Data kunnen analyseren, worden ze steeds slimmer en kunnen betere beslissingen nemen.

Bijvoorbeeld Facebook maakt ook gebruik van Machine Learning en Big Data. Als je Facebook hebt, zal je vast wel weten dat je ook voorstellen van Facebook krijgt om een vriendschapsverzoek te sturen naar mensen die je misschien kent. Deze mensen komen niet voor niets op je scherm als aanbeveling om vrienden mee te worden.

Facebook weet van elke Facebook gebruiker wat onder andere zijn interesses, vrienden, woonplaats en leeftijd is. Ook bijvoorbeeld welke evenementen je vaak bezoekt en waar. Op basis van al die data kan Facebook voorstellen doen om vrienden te worden met mensen die je waarschijnlijk kent.

Python is een populaire programmeertaal voor Machine Learning. Ook andere grote programmeertalen hebben goede libraries en frameworks om met Machine Learning aan de slag te gaan, zoals Java en C#.

Voorspellende analyse

Aan de hand van data mining kan er een voorspellende analyse worden gedaan. Data analisten kunnen de patronen en verbanden mooi visualiseren en op basis daarvan ook conclusies trekken voor de toekomst.

Een voorspellende analyse is van grote waarde voor veel organisaties en bedrijven. Op basis daarvan kunnen ze toekomstgerichte beslissingen nemen. Hierdoor doen bedrijven en organisaties goede zaken voor de toekomst. Stilstaan is namelijk achteruitgaan.

Met goede software kan je makkelijker een voorspellende analyse doen. Voorbeelden van goede software voor voorspellende analyses zijn Microsoft Azure Machine Learning en IBM Predictive Analytics.

Voorspellende analyse Big Data

Text mining

Text mining is simpel gezegd het halen van waardevolle informatie uit grote hoeveelheden tekst. Op basis daarvan kunnen daar patronen in ontdekt worden.

Voor bedrijven kan text mining erg nuttig zijn. Wat denk je van klanten recensies. Als een bedrijf ontzettend veel recensies krijgt en veel klanten over hetzelfde probleem schrijven, kan dat patroon met text mining eruit gefilterd worden. Het bedrijf kan erop inspelen en het probleem voor vele klanten oplossen.

Twitter doet ook aan text mining. Uit de vele tweets filtert Twitter eruit welke woorden en hashtags populair zijn op dat moment. Gebruikers kunnen deze woorden en hashtags zien in een trending overzicht. Ook persoonlijke trending woorden en hashtags kan Twitter weergeven, op basis van de tweets die de gebruiker plaatst.

Met Python en R zou je text mining kunnen uitvoeren. Text mining software zoals RapidMiner en MATLAB zou je daarvoor ook kunnen gebruiken.

Deep Learning

Deep Learning is onderdeel van Machine Learning. Deep Learning gaat nog een stapje verder dan Machine Learning. Het gaat meer richting de kant van hoe het menselijk brein werkt.

Computers kunnen door Deep Learning leren aan de hand van voorbeelden. Door bijvoorbeeld veel afbeeldingen van een kat als input te gebruiken voor een computer, kan de computer aan de hand van Deep Learning gaan herkennen of er een kat in een afbeelding staat.

Het menselijk brein leert ook op deze manier. Een klein kindje leert bijvoorbeeld wat een kat is door katten te zien. Het kindje vraagt aan zijn ouders wat “dat” is als ze samen buiten lopen. Dat vraagt hij meerdere malen. Zijn ouders zeggen steeds dat het een kat is. Op die manier leert het kindje begrijpen wat een kat is.

Tegenwoordig kunnen sommige computers zelfs tekst herkennen uit afbeeldingen en die tekst vertalen. Dit is allemaal mogelijk door Deep Learning.

Met Python en R zou je Deep Learning kunnen toepassen. Software zoals MATLAB en TensorFlow is ook handig om te gebruiken voor Deep Learning.

Big Data voorbeelden

Hierboven hebben we al enkele mooie voorbeelden gezien van Big Data en hoe dat in de realiteit werkt met andere technieken, zoals Machine Learning en Deep Learning. Hier gaan we naar nog meer echte voorbeelden kijken van Big Data.

Netflix

Een heel mooi voorbeeld van een groot bedrijf dat gebruik maakt van Big Data is Netflix. Dat doen ze op een slimme manier, waardoor gebruikers bij Netflix blijven.

Iedereen die Netflix heeft kent het wel, de aanbevolen films en series. Netflix gebruikt Machine Learning en Big Data om films en series aan te bevelen die helemaal bij de gebruiker passen. Door data bij te houden van de gebruiker, kan Netflix heel gepersonaliseerde aanbevelingen doen. Netflix houdt ander andere deze data per gebruiker bij:

  • Beoordelingen
  • Zoekopdrachten
  • Datum waarop bepaalde series en films zijn bekeken
  • Welke films en series zijn bekeken
  • Welk apparaat het meest gebruikt wordt om films en series te kijken
  • Wanneer een programma gepauzeerd wordt

Het komt erop neer dat Netflix eigenlijk best veel over alle gebruikers weet. Door Big Data te gebruiken, kan Netflix onder andere de beste series en films aanbevelen aan hun gebruikers, helemaal gepersonaliseerd op de behoeftes van de gebruiker.

Op deze manier blijven heel veel gebruikers bij Netflix. Netflix maakt heel slim gebruik van Big Data om de optimale service aan gebruikers te bieden.

Netflix op laptop, Big Data voorbeelden

Weerstation

Een weerstation kan het huidige weer meten, maar vaak ook voorspellingen doen voor de toekomst. Door Big Data zijn de voorspellingen nog specifieker. Het kan zelfs vele mensenlevens redden.

Een tsunami komt vaak onverwachts en kan heel veel levens kosten. Op basis van Big Data kunnen er patronen ontdekt worden over hoe tsunami’s ontstaan en welk weer daar aan vooraf gaat. Door deze patronen te herkennen, kan er beter vooraf gewaarschuwd worden voor tsunami’s.

Weerstations worden steeds slimmer en dat is in sommige gebieden ook nodig om levens te redden. Hoe eerder een tsunami of een andere natuurramp voorspeld kan worden, hoe beter.

Transport industrie

De transport industrie begint ook steeds meer gebruik te maken van Big Data. De transport industrie maakt daardoor sprongen vooruit en wordt steeds slimmer.

Een mooi voorbeeld zijn NS treinen. De NS is bezig om gebruik te gaan maken van real life monitoring. De NS wil technische gegevens ophalen van alle treinen. Zo kan de NS tijdig ingrijpen en bijvoorbeeld kapotte onderdelen van een trein vervangen.

Een ander voorbeeld is dat een een klant van een bezorgservice precies kan zien waar de bus rijdt met zijn pakketje en hoe laat het thuis arriveert. Big Data zorgt voor een juiste voorspelling van de levertijd. Dit geeft de klant duidelijkheid en voorkomt voor de bezorger een hoop irritatie.

De transport industrie heeft veel baat bij Big Data. In de toekomst zal de transport industrie steeds meer gebruik gaan maken van Big Data.

Bareigenaar die bier verkoopt

Je zal misschien denken “Wat heeft een bareigenaar die bier verkoopt met Big Data te maken?”. Nou, je kan Big Data bijna overal voor gebruiken, ook hiervoor.

Sensoren in brouwapparatuur kunnen data genereren en onder andere het volgende bijhouden:

  • Welk merk bier populair is op welk tijdstip
  • Op welke dagen en tijden drinken bezoekers het meeste bier
  • Op welke dagen drinken de bezoekers meer alcoholvrij bier

Via WiFi ontvangt een computer de data en die gaat het analyseren. De bareigenaar heeft een app waarop de data is gevisualiseerd. Hierdoor kan de eigenaar conclusies trekken en bijvoorbeeld meer bier inslaan van een bepaald merk op bepaalde dagen, wanneer het populair is onder de bezoekers.

Steeds meer bareigenaren zien het nut in van Big Data en gaan er gebruik van maken.

twee glazen bier, Big Data voorbeelden

Overheid

De overheid kan natuurlijk niet achterblijven. De overheid heeft logischerwijs al heel veel data van alle inwoners in een land, die ingeschreven staan. Met deze Big Data kan de overheid veel doen.

Steeds meer gemeentes willen hun steden smart maken, ook wel “Smart City” genoemd. Bij een Smart City zijn er veel sensoren die data genereren. Hierdoor ontstaat er Big Data.

Een mooi voorbeeld is de regenradar in Rotterdam. De regenradar meet precies hoeveel en waar het heeft geregend. Daarmee kan de gemeente Rotterdam tijdig problemen in het rioolstelsel en watersysteem signaleren en oplossen.

Dit is een enkel mooi voorbeeld over hoe de overheid met Big Data kan omgaan. Maar er zijn nog talloze voorbeelden en ideeën te bedenken over hoe de overheid Big Data slim kan inzetten. Echter is privacy ook een belangrijk item en hier zal de overheid rekening mee moeten houden.

De voor- en nadelen van Big Data

Big Data heeft veel voordelen, maar er kleven ook nadelen aan. Hieronder staan enkele voor- en nadelen van Big Data op een rijtje.

Voordelen

  • Een goede analyse van Big Data zorgt voor snellere beslissingen
  • Kostenbesparing
  • Zorgt voor veel technische innovaties
  • Bedrijven en organisaties kunnen beter toekomstgericht werken
  • Meer gepersonaliseerde service aan klanten
  • Sneller anticiperen om fouten te voorkomen
  • Verhoogt klantenloyaliteit

Nadelen

  • Te veel data kan ten koste gaan van de kwaliteit van de data
  • Risico dat hackers Big Data in handen krijgen en er verkeerde dingen mee doen
  • Privacy kan in gevaar komen

Maak van Big Data je beroep

Je hebt nu een duidelijk antwoord op de vraag “Wat is Big Data?”. De eerstvolgende verjaardag kan jij aan je ooms en tantes de betekenis van Big Data gaan uitleggen. Daarbij kan je ook mooie voorbeelden geven van Big Data.

Misschien vind je Big Data interessant en wil je er je beroep van maken of jezelf er meer in verdiepen? Bedrijven en organisaties staan te springen om mensen die verstand hebben van Big Data.

Een heel mooi beroep is data analist. Je kan speciale opleidingen en cursussen volgen om een data analist te worden. Als data analist verdien je een heel goed salaris en het werk is uitdagend.

Als je echt geïnteresseerd bent om je meer de verdiepen in Big Data, kan dat heel goed zijn voor je toekomst. Er is momenteel een te kort aan data analisten en dat zal alleen maar gaan toenemen.

Lees in “Data analist opleiding” alles over de beste data analist opleiding en cursussen om een data analist te worden. De investering zou goed zijn voor je toekomst. Je verdient het ruimschoots terug met de kennis die je ermee opdoet en het geld wat je ermee gaat verdienen.

Heb je nog vragen en/of opmerkingen? Laat dan hieronder een reactie achter of neem contact op.

Plaats een reactie