Normale verdeling en z-score

Soms zie je een klokvormige figuur terug dat de normale verdeling wordt genoemd. Interessant, maar wat moet je er mee bij HBO Statistiek?

 

Wat is een normale verdeling?

klokvormige verdelingTheoretisch gezien is een normale verdeling een verdelingsvorm; een manier om een heleboel waarden te verdelen. Dit wordt gedaan over een symmetrisch, klokvormigmodel. Dit is tevens een voorwaarde om een normale verdeling te zijn.

Een normale verdeling ontstaat over het algemeen bij veel meetwaarden (bijvoorbeeld het gewicht van bananen).

 

Wat kun je aflezen in een normale verdeling?

De klokvorm van de normale verdeling geeft een hoop informatie weg. Zo geeft het midden zowel het gemiddelde, de mediaan én de modus weg. Deze vallen allemaal gelijk.

Daarnaast geeft de normale verdeling informatie weg over hoeveel procent van de meetwaarden tussen bepaalde getallen ligt.

normale verdeling, z-score

Zo ligt er 68,27% van de waarden tussen het gemiddelde min één keer de standaarddeviatie en plus één keer de standaarddeviatie. Er ligt 95,45% ligt tussen min en plus twee keer de standaarddeviatie en 99,73% ligt tussen drie keer de standaarddeviatie.

 

De normale verdeling in praktijk

In praktijk betekent dit het volgende. Stel, we pakken 100 bananen van de oogst. Het blijkt dat deze normaal verdeeld zijn. Het gemiddelde is 50 gram (dat is dus tevens de modus en mediaan!), het minimum is 25 gram en het maximum is 75 gram. We nemen even aan dat de standaarddeviatie hier 7,5 gram is.

Tussen de blauw lijnen zit 68,27% van de meetwaarden – oftewel 68,27% van 100 betekent 68,27 bananen. Die 68,27 bananen wegen dus tussen de 50 – 7,5 gram en 50 + 7,5 gram; tussen de 42,5 en 57,5 gram.

Tussen de oranje lijnen zit 95,45% van de meetwaarden – oftewel 95,45 bananen. Deze wegen tussen de 50 – 2 x 7,5 gram en 50 + 2 x 7,5 gram; oftewel tussen de 35 en 65 gram.Tot slot zitten er tussen de groene lijnen 99,73% – 99,73 bananen. Deze zitten tussen 50 – 3 x 7,5 gram en 50 + 3 x 7,5 gram; oftewel tussen de 27,5 en 72,5 gram.

Tot slot zitten er tussen de groene lijnen 99,73% – 99,73 bananen. Deze zitten tussen 50 – 3 x 7,5 gram en 50 + 3 x 7,5 gram; oftewel tussen de 27,5 en 72,5 gram.

normale verdeling

 

Z-score en de normale verdeling

Naast dat je de normale verdeling met ‘gewone’ cijfers (de cijfers uit de steekproef) kunt invullen, kun je die ook omrekenen naar een z-score. De normale verdeling wordt dan ook wel standaard normale verdeling genoemd.

 

Met de z-scores kun je verschillende steekproeven met elkaar vergelijken. Bijvoorbeeld of de bananen die geoogst worden in Brazilië een andere verdeling hebben dan de bananen die geoogst worden in Spanje. Dit werkt een beetje hetzelfde als absolute getallen omzetten naar percentages: ook dan kun je cijfers met elkaar vergelijken.

 

De formule van de z-score is als volgt:

Bij populaties: z=(x-\mu)/\sigma

Bij steekproeven: z=(x-\bar{x})/s

 

Hierbij geldt het volgende:

  • x is de gedane meting waarvan je de z-score wilt weten
  • \mu of \bar{x} is het gemiddelde (uit de populatie of steekproef)
  • \sigma of s is de standaarddeviatie (uit de populatie of steekproef)


 

Z-score en betrouwbaarheidsintervallen

Zoals je net zag bij de grafiek met de normale verdeling dat tussen een bepaald percentage het gemiddelde min of plus de standaarddeviatie lag. Misschien is je opgevallen dat 95,45% en 99,73% lijken op de betrouwbaarheidsintervallen die veel gebruikt worden. Bij die percentages is gekozen voor een ‘mooie’ z-score, namelijk 2 en 3.

 

Vaak worden in de statistiek gerekend met ‘mooie’ betrouwbaarheidsintervallen, zoals 90%, 95% en 99%. Bij elk percentage is de bijbehorende z-score:

  • Bij 90% hoort min en plus 1,64
  • Bij 95% hoort min en plus 1,96
  • Bij 99% hoort min en plus 2,58

 

Ik raad je aan deze uit je hoofd te leren; scheelt een hoop stress en rekenwerk tijdens je tentamen!

 

Groetjes,

Marilyn

Marilyn

Was dit waardevol voor jou? Je kunt nu doneren door via deze link te shoppen. HBOstatistiek krijgt dan een kleine commissie, maar het kost jou niets extra’s!
Koop bij bol.com
In 60 sec de juiste toets kiezen

 

 

10 reacties:

  1. Hoi, ik heb een vraag:

    waarom is een normaal verdeling belangrijk voor het kiezen van je toetsen? Waarom kies je de Mann-Withney toets als de data niet normaal verdeeld is? En is deze toets dan minder betrouwbaar en waarom?

    • Hoi Kaylee,

      Een normale verdeling zegt iets over hoe de metingen in een steekproef verdeeld zijn. Voor de t toets voor onafhankelijk steekproeven moet het bijvoorbeeld de afhankelijke variabele van scale-niveau zijn én de steekproef normaal verdeeld. Waarom dit een eis is weet ik helaas niet. Als je aan één van deze voorwaarden niet kan voldoen,dan is de Mann-Whitney test een goed alternatief. In plaats van een vergelijking op basis van gemiddelden maak je een vergelijking op basis van een rangorde. Dat is niet per se slechter of minder betrouwbaar, maar anders.

      Groetjes,
      Marilyn

  2. Ik heb een vraagje over de normaalverdeling:
    Er zijn 2 groepen studenten op de havo
    1 havo met natuurkunde normaal verdeelde variabele x u=68,4 en standaarddeviatie 5,2
    2 havo zonder natuurkunde u=61,3 en standaardeviatie 6,4
    1-Hoe groot is de kans dat 6 studenten met natuurkunde een gemiddelde score behalen die hoger is dan 70?
    -Hoe groot is de kans dat 8 studenten onder natuurkunde een gemiddelde score halen die lager is dan 60?
    -Hoe groot is de kans dat het verschil tussen de gemiddelde scores van de groepen bij de 2 vorige vragen meer dan 10 bedraagt????
    Kun je mij op weg helpen?

    • Ik durf je dit met zekerheid te zeggen en ik brainstorm hardop; hier mijn redenering:
      1) In je grafische rekenmachine heb je de normalcdf functie of gebruik deze site. Deze kun je gebruiken om uit te rekenen hoeveel procent er boven de 70 zou scoren. Dat is 37,92%. Afhankelijk van hoeveel kinderen er in de groep zit, kun je nagaan hoe groot de kans is dat 6 kinderen uit die klas boven de 70 scoort.
      2) Dezelfde gedachtegang, andere gegevens: er scoort 41,95% onder de 60 in de klas zonder natuurkunde. Weet je hoeveel kinderen er in de klas zitten, dan kun je nagaan hoe groot de kans is dat 8 studenten minder dan 60 scoren.
      3) Hier durf ik geen zinnig antwoord op te geven, zelfs geen gok. Sorry! Missschien iemand anders?

  3. Hoe vind ik de z-score bij een niet normale verdeling?
    Stel ik weet het percentage, hoe kan ik de bijbehorende z-score achterhalen?

    • Hoi Kashmir,
      Ik kan niet zeggen hoe je de z-score bij een niet normale verdeling vindt. Ik zou zeggen niet, want een z-score is een standaard normale verdeling – alle z-scores houden verband met hoeveel procent van de waarnemingen daarbij horen.

      Als je een z-score wil berekenen, kun je het beste de formules gebruiken (zie artikel voor zowel populaties als steekproeven).

      Als je percentages wil berekenen dan kun je via een grafische rekenmachine gebruik maken van normalcdf(linkergrens, rechtergrens, gemiddelde, standaarddeviatie) en daaruit krijg je een percentage. Als je alleen z-scores hebt, kun je voor het gemiddelde 0 invullen en voor standaarddeviatie 1.
      Een tweede optie is om met de z-score tabel het percentage te achterhalen (alleen van links naar rechts!).

  4. wat is de juiste definitie van de z – score en z – toets?

    • Hoi Cho,
      Voor zover ik weet is z-score de juiste benaming. Een z-score wordt ook wel standaardscore genoemd – misschien bedoel je dat?
      Door standaard scores te gebruiken, kun je verschillende steekproeven met elkaar vergelijken – alsof je een soort percentages berekent.
      Groetjes,
      Marilyn

  5. Ik heb een vraag over de Z-score. Hier op de site worden een aantal “standaard” Z-scores gegeven. Als ik echter in andere tabellen ga zoeken naar deze Z-score dan kom ik uit op andere percentages? Wat is nu juist?

    • Als je de z-score opzoekt in de tabel, dan zie je daar twee percentages staan. Bij de tabel voor negatieve z-waarden is dit eerst het percentage dat links  van die z-score ligt en dan wat rechts van die z-score ligt.

      Voorbeeld: je zoekt de z-score van -1,64 op. Hier zie je staan: 5,05/94,95. Dit betekent het volgende:

      Normale verdeling z-score betrouwbaarheidsinterval

      Bij betrouwbaarheidsintervallen wil je echter weten tussen welke waarden 90% van metingen zit. Daarom haal je zowel aan de linker als rechterkant die 5% (afgerond) eraf. Dan wordt de tekening als volgt (inclusief afrondingen!):

      Normale verdeling z-score betrouwbaarheidsinterval

      Dus tussen -1,64 en +1,64 ligt dus 90% (afgerond).

      Ik hoop dat dit je vraag beantwoord; laat het anders even weten!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *