WIN wk14 / H9 / Pandas intro

Data verwerken met Pandas
Programming basics-II
Hoofdstuk 9 / Week 14
 

1 / 52
next
Slide 1: Slide
Applicatie- en mediaontwikkelaarMBOStudiejaar 1

This lesson contains 52 slides, with interactive quizzes and text slides.

Items in this lesson

Data verwerken met Pandas
Programming basics-II
Hoofdstuk 9 / Week 14
 

Slide 1 - Slide

This item has no instructions

Deze week
  • Kennis opfrissen
  • Nieuwe manier van data-analyse ('pandas')
  • Draaitabellen 

Slide 2 - Slide

This item has no instructions

Deze week
  • Kennis opfrissen
  • Nieuwe manier van data-analyse ('pandas')
  • Draaitabellen 
Nu eerst: kleine-opfris-quiz.
Let op de tijd bij meerkeuzevragen!

Slide 3 - Slide

This item has no instructions

Wat is _waarschijnlijk_ het datatype van
averageSalary na deze regel?
A
String
B
Integer
C
Float
D
Boolean

Slide 4 - Quiz

This item has no instructions


Wat is géén datatype?
A
List
B
Dictionary
C
Datetime
D
CSV

Slide 5 - Quiz

This item has no instructions

Je wil je scherm leegmaken.
Wat komt er _exact_ op de puntjes?
A
"clear"
B
"cls"
C
clear
D
cls

Slide 6 - Quiz

This item has no instructions

Je wil deze csv openen.
Wat komt er op de puntjes?
A
w
B
a
C
r
D
l

Slide 7 - Quiz

This item has no instructions

Wat komt er op de puntjes?
A
open
B
reader
C
maintenance.csv
D
planeFile

Slide 8 - Quiz

This item has no instructions

Wat komt er op de puntjes?
A
planeList = list(reader)
B
planeFile = list(reader)
C
planeList = list(planeFile)
D
planeFile = list(planeList)

Slide 9 - Quiz

This item has no instructions

Leg uit; wat is een CSV en/of
waarvoor staat de afkorting?

Slide 10 - Open question

This item has no instructions


A
$d.$m.$Y
B
%d.%m.%y
C
$d-$m-$y
D
%d-%m-%Y

Slide 11 - Quiz

This item has no instructions


A
%d/%m/%Y
B
%d/%m/%y
C
%m/%d/%Y
D
%y/%m/%d

Slide 12 - Quiz

This item has no instructions


Slide 13 - Open question

This item has no instructions

Leg uit; wat gebeurt hier?

Slide 14 - Open question

This item has no instructions

Leg uit; wat gebeurt hier?

Slide 15 - Open question

This item has no instructions

Zelfstandig werken - stappenplan:

  1. Herhalingopdracht H6 (blz 48)
  2. Bestuderen theorie H8 (blz 58)
  3. Weekcheck H8 (blz 61)
  4. Herhalingopdracht H8 (blz 62)

Stilte, werk voor jezelf
Overleg met buur is ok
Werk in groepjes
timer
30:00

Slide 16 - Slide

This item has no instructions

Weekchecks
Alle uitwerkingen tot nu toe kun je vinden op ItsLearning

NAT-PRB-II ➜ Uitwerkingen

Gebruik deze uitwerkingen om je eigen werk te controleren.
Deze uitwerkingen mag je ook tijdens de toets gebruiken!

Slide 17 - Slide

This item has no instructions

Hoofdstuk 9: Python libraries
import statement kennen we al van:
  • csv
  • os
  • datetime
  • timedelta

Slide 18 - Slide

This item has no instructions

Hoofdstuk 9: Python libraries
import statement kennen we al van:
  • csv
  • os
  • datetime
  • timedelta
Dit zijn losse libraries, maar ze worden wel standaard meegeleverd als je Python installeert.

Slide 19 - Slide

This item has no instructions

Hoofdstuk 9: Python libraries
Er zijn ook nog externe libraries, die je moet eerst downloaden voordat je ze kunt import'en.

Slide 20 - Slide

This item has no instructions

Hoofdstuk 9: Python libraries
Er zijn ook nog externe libraries, die je moet eerst downloaden voordat je ze kunt import'en.

Dit doe je met een package manager, een soort app-store voor Python-libraries.

Slide 21 - Slide

This item has no instructions

Hoofdstuk 9: Python libraries
Er zijn ook nog externe libraries, die je moet eerst downloaden voordat je ze kunt import'en.

Dit doe je met een package manager, een soort app-store voor Python-libraries.

Tip: 'package' en 'library' betekenen feitelijk hetzelfde.

Slide 22 - Slide

This item has no instructions

pip: Package Installer for Python
pip is de package manager ('app-store') voor Python.

Slide 23 - Slide

This item has no instructions

pip: Package Installer for Python
pip is de package manager ('app-store') voor Python.

pip wordt standaard meegeleverd als je Python installeert.
Check je installatie door in de terminal te runnen:

     pip --version

Slide 24 - Slide

This item has no instructions

Run "pip --version" in je terminal in VS code (of cmd-scherm).
Krijg je zoiets?
Ja
Nee

Slide 25 - Poll

This item has no instructions

Installeren packages
Voor de komende opdrachten ga je werken met 
pandas, numpy en openpyxl

Installeer de packages door in de console het volgende te typen.

pip install pandas, openpyxl, numpy

Slide 26 - Slide

This item has no instructions

pip install pandas, openpyxl, numpy

Gelukt?
Ja
Nee

Slide 27 - Poll

This item has no instructions

Pandas
Python data analysis framework




Slide 28 - Slide

This item has no instructions

Pandas
Python data analysis framework

Voordelen:
  • Echte .xlsx-files inlezen
  • Minder code voor analyse
  • Véél meer opties



Slide 29 - Slide

This item has no instructions

Pandas: voorbeeld

Slide 30 - Slide

This item has no instructions

Pandas: voorbeeld

Slide 31 - Slide

This item has no instructions

Zelf klikken en kijken
Het is een conventie ('afspraak') binnen Python om pandas altijd te importeren onder de naam "pd". Je weet; developers zijn lui. Dus men typt liever 'pd' dan helemaal 'pandas'.
Merk op dat je niet zelf een for-loop hoeft te schrijven! Je kunt in één keer van een kolom het gemiddelde opvragen. Op de achtergrond gaat pandas voor jou alle rijen af om dat te berekenen.
Mean: wij vertalen 'gemiddelde' vaak naar 'average'. Maar de wetenschappelijk correcte term is eigenlijk 'mean'.

Dit betekent in het Nederlands dus ook gewoon gemiddelde.
read_excel: je hoeft niet zelf het bestand te openen en te converteren naar een list. Pandas doet al die dingen in één keer voor jou met de functie read_excel().

Pandas kan overigens ook gewoon CSV-bestanden openen, maar een Excel is dus net zo eenvoudig!

Slide 32 - Slide

This item has no instructions

Eventueel: nog paragraaf 1 t/m 5 maken
> Lees + maak H9, paragraaf 6 + 7
Inleveren: screenshot code par. 7
timer
8:00
Klaar
Werk verder in het boekje vanaf paragraaf 6.

Slide 33 - Open question

This item has no instructions

Top Z

Slide 34 - Slide

This item has no instructions

Top Z

Slide 35 - Slide

This item has no instructions

Top Z

Slide 36 - Slide

This item has no instructions

Top Z

Slide 37 - Slide

This item has no instructions

Top Z
  • top10 is nu een variabele met alle gegevens van de top-vluchten
  • Met pandas kun je die in één keer printen, je hebt geen loop nodig
  • Pandas maakt voor jou een nette tabel:

Slide 38 - Slide

This item has no instructions

Lees + maak paragraaf 8 t/m 9 (zie blz. 62)
Inleveren: screenshot code + console van
opdracht 9.
timer
10:00
Klaar
Werk verder in het boekje vanaf paragraaf 10.

Slide 39 - Open question

This item has no instructions

Filteren

Slide 40 - Slide

This item has no instructions

Filteren

Slide 41 - Slide

This item has no instructions

Filteren

Slide 42 - Slide

This item has no instructions

Filteren

Slide 43 - Slide

This item has no instructions

Datetime in de mix

Slide 44 - Slide

This item has no instructions

Datetime in de mix

Slide 45 - Slide

This item has no instructions

Lees + maak paragraaf 10 t/m 11 (zie blz. 63)
Inleveren: screenshot code + console van
opdracht 11.
timer
10:00
Klaar
Werk verder in het boekje vanaf paragraaf 12.

Slide 46 - Open question

This item has no instructions

Slide 47 - Slide

Uitleg draaitabel. "van een bak gegevens naar een overzicht waar managers enzovoort vaak om vragen"

Slide 48 - Slide

This item has no instructions

Slide 49 - Slide

This item has no instructions

Extra

Slide 50 - Slide

This item has no instructions

Extra

Slide 51 - Slide

This item has no instructions

Aan de slag



Lees + maak H9, par. 12 t/m 14.


Daarna de weekcheck.





Klaar?
  • Bonusopdracht ✔ weekcheck
  • Herhalingsopdrachten H7
  • Herhalingsopdrachten H1 t/m 6
  • Huiswerk ander vak
Stilte, werk voor jezelf
Overleg met buur is ok
Werk in groepjes

Slide 52 - Slide

This item has no instructions