Informatie en Data 04 - 4.1 tmt 4.4 - json dataformaat en Big Data

Proefwerk
Denk aan de toets voor maandag a.s.!

  • gaat over A2 HTML&CSS en C1-2 informatie en data
  • stof is fundament èn de slides in Magister!
  • je mag 1 enkelzijdig handgeschreven A5 met aantekeningen mee (moet je wel inleveren met je toets)
  • is op papier en in de les (45 minuten)
1 / 38
volgende
Slide 1: Tekstslide
InformaticaMiddelbare schoolhavo, vwoLeerjaar 4,5

In deze les zitten 38 slides, met interactieve quizzen en tekstslides.

time-iconLesduur is: 60 min

Onderdelen in deze les

Proefwerk
Denk aan de toets voor maandag a.s.!

  • gaat over A2 HTML&CSS en C1-2 informatie en data
  • stof is fundament èn de slides in Magister!
  • je mag 1 enkelzijdig handgeschreven A5 met aantekeningen mee (moet je wel inleveren met je toets)
  • is op papier en in de les (45 minuten)

Slide 1 - Tekstslide

Deze slide heeft geen instructies

Informatie en Data

Slide 2 - Tekstslide

Deze slide heeft geen instructies

Fundament
Kerndomein C: Informatie

Informatie en data (C1-2)
4.1 tmt 4.4


Slide 3 - Tekstslide

Deze slide heeft geen instructies

Leerdoelen
Na deze les kun je:
  • beschrijven hoe het json dataformaat eruit ziet
  • uitleggen wat Big data is en 5 kenmerken noemen
  • omschrijven welke problemen met Big Data ontstaan
  • vertellen wat een data-analist doet
  • aangeven wat datamining is
  • uitleggen dat correlatie geen causaliteit bewijst






Slide 4 - Tekstslide

Rode achtergrond betekent: klas is stil, dit zijn de leerdoelen en quizzes waarbij niet overlegd mag worden.

Doel van deze les is om het leren zichtbaar te maken voor zowel leerling als docent.
dataformaat: JSON 1/3
Een dataformaat dat door webservices vaak wordt gebruikt is JSON: JavaScript Object Notation

Dit dataformaat wordt door veel API's gebruikt, niet alleen door webservices

Het JSON dataformaat heeft namelijk veel voordelen!


Slide 5 - Tekstslide

Deze slide heeft geen instructies

dataformaat: JSON 2/3
Voordelen van JSON zijn bijvoorbeeld (er zijn er meer):
  • dat de structuur goed leesbaar is voor mensen
  • dat het flexibel is (meerdere datatypes ondersteunt)
  • dat het klein en efficiënt is (qua data op de harde schijf)

Slide 6 - Tekstslide

Deze slide heeft geen instructies

dataformaat: JSON 3/3
Begin en eind
   {            }                          kan genest zijn!


sleutel is altijd een string (kan ook bv. "1" zijn)
waarde kan verschillende type zijn: int, string, array, etc
regels worden gescheiden met ,

Slide 7 - Tekstslide

Deze slide heeft geen instructies


Waar staat JSON voor?
A
JavaScript Object Notation
B
Jenga Structured Object Notation
C
Jupiter Standard for Object Navigation
D
ᵔ ᴥ ᵔ

Slide 8 - Quizvraag

Deze slide heeft geen instructies


Een JSON heeft sleutels en waarden
Wat is een JUIST voorbeeld?
A
B
C
D
─=≡Σ(((つ•̀ω•́)つ

Slide 9 - Quizvraag

Deze slide heeft geen instructies


Een JSON heeft sleutels en waarden
Wat is een JUIST voorbeeld?
A
{ 1 : "waarde" }
B
{ "1" : "waarde"; }
C
{ 1 : waarde }
D
=͟͟͞͞ =͟͟͞͞ ヘ( ´Д`)ノ (geen van allen)

Slide 10 - Quizvraag

Deze slide heeft geen instructies

Waar staat JSON voor?
(allemaal kleine letters voor groen)
timer
0:30

Slide 11 - Open vraag

Deze slide heeft geen instructies

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)

Slide 12 - Tekstslide

Deze slide heeft geen instructies

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)

Slide 13 - Tekstslide

Deze slide heeft geen instructies

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)
  3. eist hoge snelheid (Velocity)

Slide 14 - Tekstslide

Deze slide heeft geen instructies

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)
  3. eist hoge snelheid (Velocity)
  4. waardevol voor bedrijven en organisaties (Valuable)

Slide 15 - Tekstslide

Deze slide heeft geen instructies

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)
  3. eist hoge snelheid (Velocity)
  4. waardevol voor bedrijven en organisaties (Valuable)
  5. complexe data-analyse nodig (V... .... uhhh)

Slide 16 - Tekstslide

Deze slide heeft geen instructies

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)
  3. eist hoge snelheid (Velocity)
  4. waardevol voor bedrijven en organisaties (Valuable)
  5. complexe data-analyse nodig (Very complex analysis)

Slide 17 - Tekstslide

Deze slide heeft geen instructies

Big Data: grote hoeveelheid
  • Big Data bestaat heeft zó veel data dat een gewoon 
     DBMS het niet aan kan
  • Informatiedoelen zijn vooraf niet bekend, die kunnen
     ontstaan door nieuwe inzichten die voortvloeien uit
     de Big Data
  • Er wordt zoveel mogelijk informatie verzameld... waar
     moet dan extra op worden gelet?

Slide 18 - Tekstslide

Deze slide heeft geen instructies


Waar staat DBMS voor?
A
Database Multi-Source
B
Database Management System
C
Data Backup Management System
D
三三ᕕ( ᐛ )ᕗ (geen van allen)

Slide 19 - Quizvraag

Deze slide heeft geen instructies

Big Data: veel variatie
  • Big Data wordt niet opgeslagen in één database, maar in
     meerdere databases, verspreid over verschillende
     plekken
  • Big Data kan geheel of gedeeltelijk ongestructureerd zijn
     (daar moet het systeem ook mee om kunnen gaan)

Slide 20 - Tekstslide

Deze slide heeft geen instructies

Big Data: Hoge snelheidseis
Big Data moet zeer snel toegankelijk zijn , dit heeft verschillende oorzaken:
  • Big Data is heel groot (big), hééééél groot zelfs
  • en wordt ook steeds groter
  • en de data is verspreid over meerdere databases
daarom moet de data heel snel kunnen worden verzameld, gecombineerd en geanalyseerd

Slide 21 - Tekstslide

Deze slide heeft geen instructies

Big Data: Waardevol
Big Data is waardevol voor bedrijven, omdat ze door verwerken ervan goede beslissingen kunnen maken of nieuwe inzichten kunnen krijgen, zoals bijvoorbeeld:
  • veranderingen in de vraag naar een artikel
  • veranderingen in de markt
  • interesses van mensen voor gerichte advertenties
  • enzovoorts

Slide 22 - Tekstslide

Deze slide heeft geen instructies

Big Data: Complexe data-analyse
  • Big Data is data, dus nog geen informatie! De data moet 
     verwerkt (geanalyseerd) worden

  • Voor analyse wordt specialistische software gebruikt

  • Een data-analist is een specialist die dit werk doet, die
     stuurt de informatie aan en interpreteert de resultaten 

Slide 23 - Tekstslide

Deze slide heeft geen instructies


Wat is GEEN belangrijk kenmerk van Big Data?
A
grote hoeveelheid
B
complexe data analyse nodig
C
veel variatie in de data
D
╭༼ ʘ̆~◞౪◟~ʘ̆ ༽╮ (als geen ander goed is)

Slide 24 - Quizvraag

Deze slide heeft geen instructies


Wat is GEEN belangrijk kenmerk van Big Data?
A
waardevol
B
hoge snelheid vereist
C
fysieke grootte van de data
D
( ◉◞౪◟◉) (als geen ander goed is)

Slide 25 - Quizvraag

Deze slide heeft geen instructies

Wat zijn de 5 belangrijke
kenmerken van Big Data?
timer
2:00

Slide 26 - Open vraag

Deze slide heeft geen instructies

Leg in je eigen woorden uit
waarom hoge snelheid nodig is
timer
1:00

Slide 27 - Open vraag

Deze slide heeft geen instructies

Big Data: toepassingen
  • Beschrijven: inzicht te krijgen in wat er gebeurt of 
     is gebeurd en waarom (bijv. marktonderzoeken)
  • Adviseren: helpen bij het nemen van beslissingen
  • Voorspellen: helpen bij logistiek en planning van extra
     mensen (zo weten supermarkten dat ze bij mooi weer
     ijsjes, extra bier en barbecue-artikelen op voorraad
     moeten hebben)

Slide 28 - Tekstslide

Deze slide heeft geen instructies

Big Data: uitdagingen 1/2
Big Data is verspreid over veel databases... dus deze informatie kan dubbel en/of tegenstrijdig zijn
Ook kan je over 1 bepaald onderdeel meer informatie hebben dan van het andere, waardoor de balans niet goed is
Zo zijn er nog meer uitdagingen te bedenken
Het systeem moet daar mee omgaan en kunnen bepalen welke informatie kan/moet worden gebruikt

Slide 29 - Tekstslide

Deze slide heeft geen instructies

Big Data: uitdagingen 2/2
De data-analyse is dus eigenlijk een van de belangrijkste onderdelen van Big Data...
want daar worden juist die beslissingen gemaakt

De data-analist is degene die dat inregelt en interpreteert
Een andere taak van een data-analist is datamining

Slide 30 - Tekstslide

Deze slide heeft geen instructies

Big Data: data-analist 1/2
De data-analist is degene die de data analyseert...
die configureert dus de software die het doet (met data-analyse-algoritmen) en interpreteert de uitkomsten

Met datamining wordt gezocht naar verbanden in data



Slide 31 - Tekstslide

Deze slide heeft geen instructies

Big Data: data-analist 2/2
Waarvoor moet worden opgepast bij datamining is dat correlatie niet verward mag worden met causaliteit

Zo kan er correlatie bestaan tussen het aantal ijsjes dat wordt verkocht en het aantal verdrinkingen in een stad in augustus...
                            Correlation does not prove causation...

Slide 32 - Tekstslide

Deze slide heeft geen instructies

Beschrijf welke uitdaging ontstaat
door veel databases bij Big Data
timer
1:00

Slide 33 - Open vraag

Deze slide heeft geen instructies

Beschrijf welke gevolgen
ontstaan door Big Data
(behalve privacy!)
timer
1:00

Slide 34 - Open vraag

Deze slide heeft geen instructies

Beschrijf wat een
data analist doet
timer
1:00

Slide 35 - Open vraag

Deze slide heeft geen instructies

Geef/zoek een EIGEN voorbeeld
waarom correlatie geen causaliteit is
timer
1:00

Slide 36 - Open vraag

Deze slide heeft geen instructies

Leerdoelen
Je kunt nu:
  • beschrijven hoe het json dataformaat eruit ziet
  • uitleggen wat Big data is en 5 kenmerken noemen
  • omschrijven welke problemen met Big Data ontstaan
  • vertellen wat een data-analist doet
  • aangeven wat datamining is
  • uitleggen dat correlatie geen causaliteit bewijst

Slide 37 - Tekstslide

Rode achtergrond betekent: klas is stil, dit zijn de leerdoelen en quizzes waarbij niet overlegd mag worden.

Doel van deze les is om het leren zichtbaar te maken voor zowel leerling als docent.

Slide 38 - Tekstslide

Deze slide heeft geen instructies