Informatie en Data 04 - 4.1 tmt 4.4 - json dataformaat en Big Data

Informatie en Data
1 / 39
suivant
Slide 1: Diapositive
InformaticaMiddelbare schoolhavo, vwoLeerjaar 4,5

Cette leçon contient 39 diapositives, avec quiz interactifs et diapositives de texte.

time-iconLa durée de la leçon est: 60 min

Éléments de cette leçon

Informatie en Data

Slide 1 - Diapositive

Cet élément n'a pas d'instructions

Fundament
Kerndomein C: Informatie

Informatie en data (C1-2)
4.1 tmt 4.4


Slide 2 - Diapositive

Cet élément n'a pas d'instructions

Leerdoelen
Na deze les kun je:
  • beschrijven hoe het json dataformaat eruit ziet
  • uitleggen wat Big data is en 5 kenmerken noemen
  • omschrijven welke problemen met Big Data ontstaan
  • vertellen wat een data-analist doet
  • aangeven wat datamining is
  • uitleggen dat correlatie geen causaliteit bewijst






Slide 3 - Diapositive

Rode achtergrond betekent: klas is stil, dit zijn de leerdoelen en quizzes waarbij niet overlegd mag worden.

Doel van deze les is om het leren zichtbaar te maken voor zowel leerling als docent.
Jeff Bezos over data

Slide 4 - Diapositive

Cet élément n'a pas d'instructions

dataformaat: JSON 1/3
Een dataformaat dat door webservices vaak wordt gebruikt is JSON: JavaScript Object Notation

Dit dataformaat wordt door veel API's gebruikt, niet alleen door webservices

Het JSON dataformaat heeft namelijk veel voordelen!


Slide 5 - Diapositive

Cet élément n'a pas d'instructions

dataformaat: JSON 2/3
Voordelen van JSON zijn bijvoorbeeld (er zijn er meer):
  • dat de structuur goed leesbaar is voor mensen
  • dat het flexibel is (meerdere datatypes ondersteunt)
  • dat het klein en efficiënt is (qua data op de harde schijf)

Slide 6 - Diapositive

Cet élément n'a pas d'instructions

dataformaat: JSON 3/3
Begin en eind
   {            }                          kan genest zijn!


sleutel is altijd een string (kan ook bv. "1" zijn)
waarde kan verschillende type zijn, zoals: int, string, array
regels worden gescheiden met een komma: ,

Slide 7 - Diapositive

Cet élément n'a pas d'instructions


Waar staat JSON voor?
A
JavaScript Object Notation
B
Jenga Structured Object Notation
C
Jupiter Standard for Object Navigation
D
ᵔ ᴥ ᵔ

Slide 8 - Quiz

Cet élément n'a pas d'instructions

Een JSON heeft sleutels en waarden

Wat is een JUIST voorbeeld?
A
B
C
D
─=≡Σ(((つ•̀ω•́)つ

Slide 9 - Quiz

Cet élément n'a pas d'instructions


Een JSON heeft sleutels en waarden
Wat is een JUIST voorbeeld?
A
{ 1 : "waarde" }
B
{ "1" : "waarde"; }
C
{ 1 : waarde }
D
=͟͟͞͞ =͟͟͞͞ ヘ( ´Д`)ノ (geen van allen)

Slide 10 - Quiz

Cet élément n'a pas d'instructions

Waar staat JSON voor?
(allemaal kleine letters voor groen)
timer
0:30

Slide 11 - Question ouverte

Cet élément n'a pas d'instructions

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)

Slide 12 - Diapositive

Cet élément n'a pas d'instructions

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)

Slide 13 - Diapositive

Cet élément n'a pas d'instructions

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)
  3. eist hoge snelheid (Velocity)

Slide 14 - Diapositive

Cet élément n'a pas d'instructions

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)
  3. eist hoge snelheid (Velocity)
  4. waardevol voor bedrijven en organisaties (Valuable)

Slide 15 - Diapositive

Cet élément n'a pas d'instructions

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)
  3. eist hoge snelheid (Velocity)
  4. waardevol voor bedrijven en organisaties (Valuable)
  5. complexe data-analyse nodig (V... .... uhhh)

Slide 16 - Diapositive

Cet élément n'a pas d'instructions

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)
  3. eist hoge snelheid (Velocity)
  4. waardevol voor bedrijven en organisaties (Valuable)
  5. complexe data-analyse nodig (Very complex analysis)

Slide 17 - Diapositive

Cet élément n'a pas d'instructions


Waar staat DBMS voor?
A
Database Multi-Source
B
Database Management System
C
Data Backup Management System
D
三三ᕕ( ᐛ )ᕗ (geen van allen)

Slide 18 - Quiz

Cet élément n'a pas d'instructions

Big Data: grote hoeveelheid
  • Big Data bestaat heeft zó veel data dat een gewoon 
     DBMS het niet aan kan
  • Informatiedoelen zijn vooraf niet bekend, die kunnen
     ontstaan door nieuwe inzichten die voortvloeien uit
     de Big Data
  • Er wordt zoveel mogelijk informatie verzameld... en daarbij zijn de eisen van informatie van belang

Slide 19 - Diapositive

Cet élément n'a pas d'instructions

Big Data: veel variatie
  • Big Data wordt niet opgeslagen in één database, maar in
     meerdere databases, verspreid over verschillende
     plekken
  • Big Data kan geheel of gedeeltelijk ongestructureerd zijn (daar moet het systeem ook mee om kunnen gaan)
    waar zou dit door komen?

Slide 20 - Diapositive

Cet élément n'a pas d'instructions

Big Data: veel variatie
  • Big Data wordt niet opgeslagen in één database, maar in
     meerdere databases, verspreid over verschillende
     plekken
  • Big Data kan geheel of gedeeltelijk ongestructureerd zijn (daar moet het systeem ook mee om kunnen gaan)
    waar zou dit door komen?
    doordat er meerdere verschillende bronnen zijn

Slide 21 - Diapositive

Cet élément n'a pas d'instructions

Big Data: Hoge snelheidseis
Big Data moet heel snel èn heel toegankelijk zijn, omdat:
  • Big Data is héééél groot
  • wordt steeds groter
  • en de data is verspreid over meerdere databases

daarom moet de data heel snel kunnen worden verzameld, gecombineerd en geanalyseerd

Slide 22 - Diapositive

Cet élément n'a pas d'instructions

Big Data: Waardevol
Big Data is waardevol voor bedrijven, omdat ze door verwerken ervan goede beslissingen kunnen maken of nieuwe inzichten kunnen krijgen, zoals bijvoorbeeld:
  • veranderingen in de vraag naar een artikel
  • veranderingen in de markt
  • interesses van mensen voor gerichte advertenties
  • enzovoorts

Slide 23 - Diapositive

Cet élément n'a pas d'instructions

Big Data: Complexe data-analyse
  • De data moet verwerkt (geanalyseerd) worden
     Big Data is data, dus nog geen informatie!

  • Voor analyse wordt specialistische software gebruikt

  • Een data-analist is een specialist die data analyseert,
     
    de informatie aanstuurt en de resultaten interpreteert 

Slide 24 - Diapositive

Cet élément n'a pas d'instructions


Wat is GEEN belangrijk kenmerk van Big Data?
A
grote hoeveelheid
B
complexe data analyse nodig
C
veel variatie in de data
D
╭༼ ʘ̆~◞౪◟~ʘ̆ ༽╮ geen van allen

Slide 25 - Quiz

Cet élément n'a pas d'instructions


Wat is GEEN belangrijk kenmerk van Big Data?
A
waardevol
B
hoge snelheid vereist
C
fysieke grootte van de data
D
( ◉◞౪◟◉) geen van allen

Slide 26 - Quiz

Cet élément n'a pas d'instructions

Wat zijn de 5 belangrijke
kenmerken van Big Data?
timer
2:00

Slide 27 - Question ouverte

Cet élément n'a pas d'instructions

Leg in je eigen woorden uit
waarom hoge snelheid nodig is
timer
1:00

Slide 28 - Question ouverte

Cet élément n'a pas d'instructions

Big Data: toepassingen
  • Beschrijven: inzicht te krijgen in wat er gebeurt of 
     is gebeurd en waarom (bijv. marktonderzoeken)
  • Adviseren: helpen bij het nemen van beslissingen
  • Voorspellen: helpen bij logistiek en planning van extra
     mensen (zo weten supermarkten dat ze bij mooi weer
     ijsjes, extra bier en barbecue-artikelen op voorraad
     moeten hebben)

Slide 29 - Diapositive

Cet élément n'a pas d'instructions

Big Data: uitdagingen 1/2
Big Data is verspreid over veel databases... dus deze informatie kan dubbel en/of tegenstrijdig zijn
Ook kan je over 1 bepaald onderdeel meer informatie hebben dan van het andere, waardoor de balans niet goed is
Zo zijn er nog meer uitdagingen te bedenken
Het systeem moet daar mee omgaan en kunnen bepalen welke informatie kan/moet worden gebruikt

Slide 30 - Diapositive

Cet élément n'a pas d'instructions

Big Data: uitdagingen 2/2
De data-analyse is dus eigenlijk een van de belangrijkste onderdelen van Big Data...
want daar worden juist die beslissingen gemaakt

De data-analist is degene die dat inregelt en interpreteert
Een andere taak van een data-analist is datamining

Slide 31 - Diapositive

Cet élément n'a pas d'instructions

Big Data: data-analist 1/2
De data-analist is degene die de data analyseert...
die configureert dus de software die het doet (met data-analyse-algoritmen) en interpreteert de uitkomsten

Met datamining wordt gezocht naar verbanden in data



Slide 32 - Diapositive

Cet élément n'a pas d'instructions

Big Data: data-analist 2/2
Waarvoor moet worden opgepast bij datamining is dat correlatie niet verward mag worden met causaliteit

Zo kan er correlatie bestaan tussen het aantal ijsjes dat wordt verkocht en het aantal verdrinkingen in een stad in augustus...
                            Correlation does not prove causation...

Slide 33 - Diapositive

Cet élément n'a pas d'instructions

Beschrijf welke uitdaging ontstaat
door veel databases bij Big Data
timer
1:00

Slide 34 - Question ouverte

Cet élément n'a pas d'instructions

Beschrijf welke gevolgen
ontstaan door Big Data
(behalve privacy!)
timer
1:00

Slide 35 - Question ouverte

Cet élément n'a pas d'instructions

Beschrijf wat een
data analist doet
timer
1:00

Slide 36 - Question ouverte

Cet élément n'a pas d'instructions

Geef/zoek een EIGEN voorbeeld
waarom correlatie geen causaliteit is
timer
1:00

Slide 37 - Question ouverte

Cet élément n'a pas d'instructions

Leerdoelen
Je kunt nu:
  • beschrijven hoe het json dataformaat eruit ziet
  • uitleggen wat Big data is en 5 kenmerken noemen
  • omschrijven welke problemen met Big Data ontstaan
  • vertellen wat een data-analist doet
  • aangeven wat datamining is
  • uitleggen dat correlatie geen causaliteit bewijst

Slide 38 - Diapositive

Rode achtergrond betekent: klas is stil, dit zijn de leerdoelen en quizzes waarbij niet overlegd mag worden.

Doel van deze les is om het leren zichtbaar te maken voor zowel leerling als docent.

Slide 39 - Diapositive

Cet élément n'a pas d'instructions