Statistiek is gegevens uit grote dataset halen, maar hoe doe je dit met de standaard Casio rekenmachine? Je moet je gegevens in je rekenmachine zetten en dan het gemiddelde, de standaarddeviatie en de N.
Stel je hebt de volgende gegevens:
5 mensen die hebben 0 keer (een zwembad bezocht in 1 week)
2 mensen die hebben 1 keer (een zwembad bezocht in 1 week)
3 mensen die hebben 2 keer (een zwembad bezocht in 1 week)
5 mensen die hebben 3 keer (een zwembad bezocht in 1 week)
4 mensen die hebben 4 keer (een zwembad bezocht in 1 week)
2 mensen die hebben 5 keer (een zwembad bezocht in 1 week)
Wat tussen de haakjes staat maakt in principe niet uit, dit zijn loze gegevens.
Het plaatje ervan:
De N
De N waarde is het aantal proefpersonen waar je mee wilt rekenen. Tel het aantal mensen op en je hebt ze. In dit geval: 21.
Het gemiddelde
Het gemiddelde is een waarde die wordt verkregen door alle getallen op te tellen en dan te delen door het aantal. Hier moet je wel rekening houden met het aantal bezoeken dat iemand heeft gedaan, dit weegt mee. Dus:
5 * 0 = 0
2 * 1 = 2
3 * 2 = 6
5 * 3 = 15
4 * 4 = 16
2 * 5 = 10
Totaal: 49
Nu moet je dit delen door het aantal proefpersonen dat je had, nu gaat het aantal bezoeken dat iemand heeft gedaan dus echt tellen. 49 / 21 = 2,33
De standaarddeviatie ook wel de standaardafwijking
De standaarddeviatie geeft aan hoe goed je gegevens zijn verspreid over verschillende waarde. Je zou bij dit voorbeeld een hele kleine standaarddeviatie hebben als iedereen maar 1 bezoek had gepleegd, dan zouden alle personen op de 1 liggen. De spreiding zou groot zijn als iedereen een verschillend aantal bezoeken had gepleegd, dus de ene 1 een ander 5 en weer een ander 10 en dit voor alle 22 personen.
De standaarddeviatie bereken je door de wortel uit de variantie te nemen.
De variantie
De variantie is ook een maat voor de spreiding, dit verschilt voor een steekproef en populatie. Omdat we hier spreken van een steekproef (we hebben niet alle zwembad bezoekers genomen) is het als volgt:

Ziet er lastig uit maar is als volgt:
De variantie is in het kwadraat zoals je ziet, dit is omdat de formule de som van het kwadraat berekent. Dus variantie is
en standaardafwijking is s.
Nu neem je de waarde
dit zijn de hoeveelheden keer gegaan van je proefpersonen, dus voor de eerste 5 proefpersonen is dit 0, 0, 0, 0, 0 de eerste 5 zijn 0 keer gegaan.
Het totale rijtje ziet er zo uit:
0,0,0,0,0,1,1,2,2,2,3,3,3,3,3,4,4,4,4,5,5
Hier haal je het eerder berekende gemiddelde per waarde vanaf en kwadrateer je. Het totaal tel je dan op. Dus:
$$!
(0 – 2,33)^2 + (0 – 2,33)^2 + (0 – 2,33)^2 + (0 – 2,33)^2 + (0 – 2,33)^2 + (1 – 2,33)^2 + (1 – 2,33)^2 + (2 – 2,33)^2 + (2 – 2,33)^2 + (2 – 2,33)^2 + (3 – 2,33)^2 + (3 – 2,33)^2 + (3 – 2,33)^2 + (3 – 2,33)^2 + (3 – 2,33)^2 + (4 – 2,33)^2 + (4 – 2,33)^2 + (4 – 2,33)^2 + (4 – 2,33)^2 + (5 – 2,33)^2 + (5 – 2,33)^2
$$
Nou zoals je ziet is dit een redelijk grote formule, doe je dit voor een N is 100 dan is dit al gauw een half A4. Daarom nu de uitleg met je rekenmachine, het is wel belangrijk dat dit helder is, anders weet je niet goed wat je doet.
Statistiek met een Casio
Tip: probeer dit gelijk uit!
1 – Zorg dat je hele rekenmachine (en het geheugen) schoon is. (CLR)
2 – Zet je rekenmachine op de juiste mode SD (van standaarddeviatie) (MODE + SD-toets)
3 – Vul per proefpersoon de score in (het bovenstaande rijtje van 0,0,0 etc. ) (“Score” + M+)
M+ staat voor het opslaan in je geheugen zodat je rekenmachine ermee kan gaan rekenen.
4 – Heb je dit gedaan dan kun je ermee gaan rekenen.
De N wordt als het goed is al weergegeven
Het gemiddelde bereken je door: (S-VAR) (
) = 2,33
De standaarddeviatie bereken je door: (S-VAR) (
) = 1,713


