Informatie en Data 04 - 4.1 tmt 4.4 - json dataformaat en Big Data

Informatie en Data
1 / 39
volgende
Slide 1: Tekstslide
InformaticaMiddelbare schoolhavo, vwoLeerjaar 4,5

In deze les zitten 39 slides, met interactieve quizzen en tekstslides.

time-iconLesduur is: 60 min

Onderdelen in deze les

Informatie en Data

Slide 1 - Tekstslide

Deze slide heeft geen instructies

Fundament
Kerndomein C: Informatie

Informatie en data (C1-2)
4.1 tmt 4.4


Slide 2 - Tekstslide

Deze slide heeft geen instructies

Leerdoelen
Na deze les kun je:
  • beschrijven hoe het json dataformaat eruit ziet
  • uitleggen wat Big data is en 5 kenmerken noemen
  • omschrijven welke problemen met Big Data ontstaan
  • vertellen wat een data-analist doet
  • aangeven wat datamining is
  • uitleggen dat correlatie geen causaliteit bewijst






Slide 3 - Tekstslide

Rode achtergrond betekent: klas is stil, dit zijn de leerdoelen en quizzes waarbij niet overlegd mag worden.

Doel van deze les is om het leren zichtbaar te maken voor zowel leerling als docent.
Jeff Bezos over data

Slide 4 - Tekstslide

Deze slide heeft geen instructies

dataformaat: JSON 1/3
Een dataformaat dat door webservices vaak wordt gebruikt is JSON: JavaScript Object Notation

Dit dataformaat wordt door veel API's gebruikt, niet alleen door webservices

Het JSON dataformaat heeft namelijk veel voordelen!


Slide 5 - Tekstslide

Deze slide heeft geen instructies

dataformaat: JSON 2/3
Voordelen van JSON zijn bijvoorbeeld (er zijn er meer):
  • dat de structuur goed leesbaar is voor mensen
  • dat het flexibel is (meerdere datatypes ondersteunt)
  • dat het klein en efficiënt is (qua data op de harde schijf)

Slide 6 - Tekstslide

Deze slide heeft geen instructies

dataformaat: JSON 3/3
Begin en eind
   {            }                          kan genest zijn!


sleutel is altijd een string (kan ook bv. "1" zijn)
waarde kan verschillende type zijn, zoals: int, string, array
regels worden gescheiden met een komma: ,

Slide 7 - Tekstslide

Deze slide heeft geen instructies


Waar staat JSON voor?
A
JavaScript Object Notation
B
Jenga Structured Object Notation
C
Jupiter Standard for Object Navigation
D
ᵔ ᴥ ᵔ

Slide 8 - Quizvraag

Deze slide heeft geen instructies

Een JSON heeft sleutels en waarden

Wat is een JUIST voorbeeld?
A
B
C
D
─=≡Σ(((つ•̀ω•́)つ

Slide 9 - Quizvraag

Deze slide heeft geen instructies


Een JSON heeft sleutels en waarden
Wat is een JUIST voorbeeld?
A
{ 1 : "waarde" }
B
{ "1" : "waarde"; }
C
{ 1 : waarde }
D
=͟͟͞͞ =͟͟͞͞ ヘ( ´Д`)ノ (geen van allen)

Slide 10 - Quizvraag

Deze slide heeft geen instructies

Waar staat JSON voor?
(allemaal kleine letters voor groen)
timer
0:30

Slide 11 - Open vraag

Deze slide heeft geen instructies

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)

Slide 12 - Tekstslide

Deze slide heeft geen instructies

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)

Slide 13 - Tekstslide

Deze slide heeft geen instructies

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)
  3. eist hoge snelheid (Velocity)

Slide 14 - Tekstslide

Deze slide heeft geen instructies

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)
  3. eist hoge snelheid (Velocity)
  4. waardevol voor bedrijven en organisaties (Valuable)

Slide 15 - Tekstslide

Deze slide heeft geen instructies

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)
  3. eist hoge snelheid (Velocity)
  4. waardevol voor bedrijven en organisaties (Valuable)
  5. complexe data-analyse nodig (V... .... uhhh)

Slide 16 - Tekstslide

Deze slide heeft geen instructies

Big Data
Big Data is meer dan gewoon "veel data"
Big Data heeft 5 belangrijke kenmerken:
  1. gigantisch grote hoeveelheid (Volume)
  2. veel variatie in de data (Variation)
  3. eist hoge snelheid (Velocity)
  4. waardevol voor bedrijven en organisaties (Valuable)
  5. complexe data-analyse nodig (Very complex analysis)

Slide 17 - Tekstslide

Deze slide heeft geen instructies


Waar staat DBMS voor?
A
Database Multi-Source
B
Database Management System
C
Data Backup Management System
D
三三ᕕ( ᐛ )ᕗ (geen van allen)

Slide 18 - Quizvraag

Deze slide heeft geen instructies

Big Data: grote hoeveelheid
  • Big Data bestaat heeft zó veel data dat een gewoon 
     DBMS het niet aan kan
  • Informatiedoelen zijn vooraf niet bekend, die kunnen
     ontstaan door nieuwe inzichten die voortvloeien uit
     de Big Data
  • Er wordt zoveel mogelijk informatie verzameld... en daarbij zijn de eisen van informatie van belang

Slide 19 - Tekstslide

Deze slide heeft geen instructies

Big Data: veel variatie
  • Big Data wordt niet opgeslagen in één database, maar in
     meerdere databases, verspreid over verschillende
     plekken
  • Big Data kan geheel of gedeeltelijk ongestructureerd zijn (daar moet het systeem ook mee om kunnen gaan)
    waar zou dit door komen?

Slide 20 - Tekstslide

Deze slide heeft geen instructies

Big Data: veel variatie
  • Big Data wordt niet opgeslagen in één database, maar in
     meerdere databases, verspreid over verschillende
     plekken
  • Big Data kan geheel of gedeeltelijk ongestructureerd zijn (daar moet het systeem ook mee om kunnen gaan)
    waar zou dit door komen?
    doordat er meerdere verschillende bronnen zijn

Slide 21 - Tekstslide

Deze slide heeft geen instructies

Big Data: Hoge snelheidseis
Big Data moet heel snel èn heel toegankelijk zijn, omdat:
  • Big Data is héééél groot
  • wordt steeds groter
  • en de data is verspreid over meerdere databases

daarom moet de data heel snel kunnen worden verzameld, gecombineerd en geanalyseerd

Slide 22 - Tekstslide

Deze slide heeft geen instructies

Big Data: Waardevol
Big Data is waardevol voor bedrijven, omdat ze door verwerken ervan goede beslissingen kunnen maken of nieuwe inzichten kunnen krijgen, zoals bijvoorbeeld:
  • veranderingen in de vraag naar een artikel
  • veranderingen in de markt
  • interesses van mensen voor gerichte advertenties
  • enzovoorts

Slide 23 - Tekstslide

Deze slide heeft geen instructies

Big Data: Complexe data-analyse
  • De data moet verwerkt (geanalyseerd) worden
     Big Data is data, dus nog geen informatie!

  • Voor analyse wordt specialistische software gebruikt

  • Een data-analist is een specialist die data analyseert,
     
    de informatie aanstuurt en de resultaten interpreteert 

Slide 24 - Tekstslide

Deze slide heeft geen instructies


Wat is GEEN belangrijk kenmerk van Big Data?
A
grote hoeveelheid
B
complexe data analyse nodig
C
veel variatie in de data
D
╭༼ ʘ̆~◞౪◟~ʘ̆ ༽╮ geen van allen

Slide 25 - Quizvraag

Deze slide heeft geen instructies


Wat is GEEN belangrijk kenmerk van Big Data?
A
waardevol
B
hoge snelheid vereist
C
fysieke grootte van de data
D
( ◉◞౪◟◉) geen van allen

Slide 26 - Quizvraag

Deze slide heeft geen instructies

Wat zijn de 5 belangrijke
kenmerken van Big Data?
timer
2:00

Slide 27 - Open vraag

Deze slide heeft geen instructies

Leg in je eigen woorden uit
waarom hoge snelheid nodig is
timer
1:00

Slide 28 - Open vraag

Deze slide heeft geen instructies

Big Data: toepassingen
  • Beschrijven: inzicht te krijgen in wat er gebeurt of 
     is gebeurd en waarom (bijv. marktonderzoeken)
  • Adviseren: helpen bij het nemen van beslissingen
  • Voorspellen: helpen bij logistiek en planning van extra
     mensen (zo weten supermarkten dat ze bij mooi weer
     ijsjes, extra bier en barbecue-artikelen op voorraad
     moeten hebben)

Slide 29 - Tekstslide

Deze slide heeft geen instructies

Big Data: uitdagingen 1/2
Big Data is verspreid over veel databases... dus deze informatie kan dubbel en/of tegenstrijdig zijn
Ook kan je over 1 bepaald onderdeel meer informatie hebben dan van het andere, waardoor de balans niet goed is
Zo zijn er nog meer uitdagingen te bedenken
Het systeem moet daar mee omgaan en kunnen bepalen welke informatie kan/moet worden gebruikt

Slide 30 - Tekstslide

Deze slide heeft geen instructies

Big Data: uitdagingen 2/2
De data-analyse is dus eigenlijk een van de belangrijkste onderdelen van Big Data...
want daar worden juist die beslissingen gemaakt

De data-analist is degene die dat inregelt en interpreteert
Een andere taak van een data-analist is datamining

Slide 31 - Tekstslide

Deze slide heeft geen instructies

Big Data: data-analist 1/2
De data-analist is degene die de data analyseert...
die configureert dus de software die het doet (met data-analyse-algoritmen) en interpreteert de uitkomsten

Met datamining wordt gezocht naar verbanden in data



Slide 32 - Tekstslide

Deze slide heeft geen instructies

Big Data: data-analist 2/2
Waarvoor moet worden opgepast bij datamining is dat correlatie niet verward mag worden met causaliteit

Zo kan er correlatie bestaan tussen het aantal ijsjes dat wordt verkocht en het aantal verdrinkingen in een stad in augustus...
                            Correlation does not prove causation...

Slide 33 - Tekstslide

Deze slide heeft geen instructies

Beschrijf welke uitdaging ontstaat
door veel databases bij Big Data
timer
1:00

Slide 34 - Open vraag

Deze slide heeft geen instructies

Beschrijf welke gevolgen
ontstaan door Big Data
(behalve privacy!)
timer
1:00

Slide 35 - Open vraag

Deze slide heeft geen instructies

Beschrijf wat een
data analist doet
timer
1:00

Slide 36 - Open vraag

Deze slide heeft geen instructies

Geef/zoek een EIGEN voorbeeld
waarom correlatie geen causaliteit is
timer
1:00

Slide 37 - Open vraag

Deze slide heeft geen instructies

Leerdoelen
Je kunt nu:
  • beschrijven hoe het json dataformaat eruit ziet
  • uitleggen wat Big data is en 5 kenmerken noemen
  • omschrijven welke problemen met Big Data ontstaan
  • vertellen wat een data-analist doet
  • aangeven wat datamining is
  • uitleggen dat correlatie geen causaliteit bewijst

Slide 38 - Tekstslide

Rode achtergrond betekent: klas is stil, dit zijn de leerdoelen en quizzes waarbij niet overlegd mag worden.

Doel van deze les is om het leren zichtbaar te maken voor zowel leerling als docent.

Slide 39 - Tekstslide

Deze slide heeft geen instructies