95 betrouwbaarheidsinterval (of intervalschatting)

Een 95 betrouwbaarheidsinterval is een percentage waarmee je aangeeft hoeveel kans er is dat de gemeten variabele tussen bepaalde waarden ligt. Concreter: ik kan bijvoorbeeld met 95% zekerheid (betrouwbaarheidsinterval) zeggen dat het gemiddelde van spaargeld tussen de €1500 en €2500 ligt.

 

Waarom een betrouwbaarheidsinterval?

Een betrouwbaarheidsinterval wordt gebruikt om conclusies vanuit een steekproef te generaliseren naar de populatie. Alhoewel je geprobeerd hebt om zo’n representatieve steekproef als mogelijk te nemen, kan het natuurlijk altijd iets afwijken.

Daarom wordt er een slag om de arm gehouden: 95 betrouwbaarheidsinterval wil dan ook zeggen dat als het experiment vaak genoeg herhaalt wordt, in 95% van de gevallen de waardeen ook tussen X en Y liggen. Het gemiddelde vanuit de steekproef, laten we het Y noemen, ligt tussen X en Z in.

Tevens betekent dit dat er ook een foutmarge wordt gemeld: de alfa. Bij een 95 betrouwbaarheidsinterval is dit 5% (100% – 95% = 5%). Dat betekent dus dat er 5% kans is dat het in de populatie niet tussen X en Z ligt.

 

Twee manieren van een betrouwbaarheidsinterval gebruiken

Bij hbo statistiek moet de betrouwbaarheidsinterval op twee manieren kunnen worden uitgerekend.

Ten eerste moet er eenbetrouwbaarheidsinterval rondom het gemiddelde worden uitgerekend. Dat kan zo zijn zoals in het eerste voorbeeld werd aangegeven: “Er is 95% zekerheid dat het gemiddelde spaargeld in de Nederlandse populatie tussen de €1500 en €2500 ligt” (fictieve getallen!).

Ten tweede moet de betrouwbaarheidsinterval kunnen worden uitgerekend rondom een proportie. Een proportie, of ‘gedeelte van’, wordt uitgedrukt in een percentage. Bijvoorbeeld: “In deze steekproef meldt 45% van de werknemers zich één keer per maand ziek”. Met de 95 betrouwbaarheidsinterval zou het in de populatie als volgt kunnen zijn: “Er kan met 95% zekerheid worden gezegd dat er tussen de 40% en 50% van de werknemers zich één keer per maand ziek meldt” (fictieve getallen).

 

Andere betrouwbaarheidsintervallen

Naast het 95 betrouwbaarheidsinterval worden er nog meer gebruikt. Bijvoorbeeld 90% en 99%. Hierbij horen respectievelijk de foutkansen (alfa) van 10% en 1%.

Je kunt de interval van getallen kleiner maken – dus van ‘tussen de 10 en 14’ naar ‘tussen de 11 en 13’. Dit kan op de volgende manieren:

  • Een kleiner betrouwbaarheidspercentage kiezen – dus in plaats van 95% kies je nu 90%. Dit betekent tevens dat de kans dat je het fout hebt verhoogt van 5% naar 10%!
  • Een grotere steekproef trekken. Over het algemeen geldt dat een grotere steekproef representatiever is voor de populatie (mits goed getrokken natuurlijk!).
  • Bij een kleinere spreiding (standaarddeviatie). Als er minder ‘verdeeldheid’ heerst binnen de groep, is het makkelijker de conclusies te generaliseren naar de gehele populatie.
Was dit waardevol voor jou? Je kunt nu doneren door via deze link te shoppen. HBOstatistiek krijgt dan een kleine commissie, maar het kost jou niets extra’s!
Koop bij bol.com
In 60 sec de juiste toets kiezen

 

 

21 reacties:

  1. Beste Marilyn,

    Ik had ene vraag. Als de 0 in de BI staat, wat zegt dat over je resultaten. Bijvoorbeeld BI (-5-10). Met een OR van 3.6. Vervalt dan de H0 omdat de BI door de 0 gaat? En wat zegt het verder? Bedankt!

    • Als je BI rondom -5 tot 10 ligt, betekent dat dat je kunt zeggen dat de gegevens van de steekproef zich zo naar de populatie vertalen.
      Stel bijvoorbeeld dat je temperaturen meet en in je steekproef meet je een gemiddelde van 2,5. Mogelijk dat met een intervalschatting de temperaturen ergens tussen de -5 en 10 liggen. Afhankelijk van wat je H0 is, hoeft die dus niet per se te vervallen als het minder dan 0 wordt.
      (Ik weet helaas niet wat OR is.)

    • Als de 0 binnen het interval valt bij een risicoverschil, is de waarde niet significant. Een OR is een ratio; in dit geval mag de 1 niet in het interval liggen.

  2. Ik vind het moeilijk om te bepalen hoeveel respondenten ik minimaal nodig heb voor mijn onderzoek.
    Mijn populatie is rond de 500.000 personen. ik wilde eerst 95% betrouwbaarheid gebruiken met dus een foutmarge van 5%, waar je dus volgens verschillende bronnen op minimaal 384 respondenten uitkomt.
    Maar dit ga ik niet halen. Daarom wil ik mijn betrouwbaarheidsinterval verlagen naar 90%.
    Ik vroeg me af of of je met 90% ook een foutmarge van 5% kan hanteren?
    Volgens een steekproefcalculator zou dit kunnen en kom ik dan op 271 respondenten uit wat ik denk ik net wel ga halen. Als ik hier 10% foutmarge invul daalt dit meteen naar rond de 70 respondenten en is mijn onderzoek meteen een stuk minder betrouwbaar. Kan je zelf de foutmarge en betrouwbaarheid aangeven als die niet precies 100% wordt?
    Hoe kan ik toch op een manier aangeven dat ik met rond de 270 respondenten een valide en betrouwbare onderzoek heb.

  3. Heej!

    Bestaat er een formule om de validiteit te berekenen van de steekproefgrootte berekend aan de hand van het betrouwbaarheidsinterval?

  4. Hoi Hoi!
    Ik ben momenteel bezig met mijn scriptie en ik ben één van de weinige die heeft gekozen voor een enquête. Het gaat over de Franse potentiële populatie tussen de 30 – 45 jaar wat meer is dan 20 000. Ik heb 384 respondenten nodig voor een 95% betrouwbaarheid, maar zit nu op 276 en ik denk dat ik de 300 nog kan halen, maar niet de 384, want moet verder met mijn onderzoek. Ik heb dus de 90% betrouwbaarheid wel gehaald waar ik ontzettend blij mee ben, want het was echt totaal niet makkelijk om die te krijgen.
    Nu moet ik dat gaan verantwoorden en goed in mijn scriptie vermelden, maar hoe moet ik dat vermelden en zijn mijn aanbevelingen dan zo anders? Ik kan in ieder geval indicaties geven toch over hoe de situatie er nu voor ligt?
    Tevens heb ik ook een aantal interviews gedaan, wat doet dat dan met de betrouwbaarheid en hoe kan ik dat dan meten?

    Ik hoor graag van u.

    Met vriendelijke groet,

    Lieve Hommeles

    • Hoi Lieve,

      De betrouwbaarheid zegt iets over of je steekproef resultaten ook gelden voor je populatie. Met 90% is er een iets grotere foutmarge (alfa van 10%) dan bij 95% (alfa van 5%). Desalniettemin kun je prima uitspraken doen en aanbevelingen geven. Je moet alleen iets meer slag om de arm houden. Bij de discussie zou je kunnen vermelden dat het voor een toekomstig onderzoek gewenst is om een grotere steekproef te nemen.

      Interviews zijn een kwalitatieve onderzoeksmethode. Je kunt nagaan in hoeverre de geïnterviewden en antwoorden representatief zijn voor de doelgroep (populatie). Als je alleen maar mannen hebt geïnterviewd hebt, terwijl de populatie gemixt is, dan is dit belangrijk om in je achterhoofd te houden. Waarschijnlijk zijn de resultaten dan niet goed te generaliseren. Ook kun je afvragen of mensen eerlijk hebben geantwoord. Dit is zeker bij ‘zware’ onderwerpen aan de orde. ‘Meten’ met cijfers gaat hier niet echt; je zult zelf een inschatting moeten maken van de betrouwbaarheid op basis van bijvoorbeeld representativiteit van de geïnterviewden en mate van generalisatie.

      Succes!
      Marilyn

  5. Ik heb een onderzoek uitgevoerd voor een museale instelling welke een product heeft voor drie doelgroepen. Tijdens de onderzoeksperiode heb ik ruim 450 vragenlijsten binnengehaald waarbij er 385 bij een betrouwbaarheidsniveau van 95 optimaal zijn. Echter keurde mijn beoordelaar het onderzoek af omdat ik met drie doelgroepen werk en voor elke doelgroep volgens hem 385 vragenlijsten diende te hebben waardoor je 1000+ totaal nodig zou hebben, totaal onrealistisch.

    De mogelijkheid is nu om het betrouwbaarheidsniveau terug te schroeven naar 80 zodat elke doelgroep 163 vragenlijsten nodig heeft, welke ook ongeveer zijn opgehaald per doelgroep. Welke gevolgen heeft dit voor mijn onderzoeksresultaten.

    Ik dien dit namelijk te verdedigen tijdens mijn eindassesment…

    • Hoi Joey,

      Als je je betrouwbaarheidsniveau naar beneden schroeft – van 95% naar 80% bijvoorbeeld – zegt dit iets over in hoeverre de resultaten van de steekproef naar de populatie te vertalen zijn. Bij 95% betrouwbaarheid is er een alfa (foutmarge) van 5%. Bij 80% is dit 20%.

      Als je het bijvoorbeeld over gemiddelden hebt, zal de range daarvan keiner zijn. Stel dat in de steekproef het gemiddelde liter water dat een volwassene drinkt 1,4 liter is. Met een 95% betrouwbaarheidsinterval zou je kunnen zeggen dat het dan in de populatie dan bijvoorbeeld tussen de 1,0 en 1,8 is. Bij 80% is het bijvoorbeeld tussen de 1,2 en 1,6 – maar daar ben je dus minder zeker van en is er 20% kans dat het helemaal niet tussen die range ligt.

      Hopelijk kun je hier verder mee.
      Groetjes,
      Mariln

  6. Leesbaar: misschien wel… correct helaas niet. Deze definitie van een betrouwbaarheidsinterval (BI) klopt niet helemaal. De werkelijke betekenis ligt een stukje ingewikkelder. Dat kunnen we helaas niet eenvoudiger maken, zonder dat we het risico lopen op grove statistische blunders.

    In werkelijkheid kun je niet zeggen dat er 95% “zekerheid” is dat een populatiegemiddelde tussen twee waarden ligt, hoe graag we dat ook zouden willen. Denk er maar eens over na: de grenzen van een BI zullen voor elke herhaalde steekproef (waarin je bijvoorbeeld spaargeld meet) weer anders zijn. Ze komen tot stand als een resultaat van een toevalsproces. Je trekt in feite “bij toeval” een BI uit de vele die je had kunnen trekken. Een eenmaal “gevonden” BI bevat het gemiddelde spaargeld van iedereen “wel” (100% kans) of “niet” (0% kans), maar zeker niet “misschien”. Dat geldt alleen maar voor de procedure… In 95% van de gevallen zul je met de procedure een interval gaan vinden dat het gemiddelde bevat. Dat is wél “misschien”.

    Vergelijk het met iemand die bij je aanbelt. Je loopt naar de deur en vraagt je af of deze persoon blauwe ogen zal hebben. Die kans schat je in op 30% (ik noem maar wat). Dan trek je de deur open, en kun je het resultaat van het toevalsproces bekijken: jahoor, het is de blauwogige buurvrouw Janssen. Het resultaat van het toevalsproces is: de ogen zijn blauw. Te zeggen dat het BI een kans van 95% heeft om het gemiddelde spaargeld van iedereen te bevatten, is hetzelfde als om in dit voorbeeld te zeggen dat de kans dat buurvrouw Janssen blauwe ogen heeft 30% is. En dat klopt niet. Deze specifieke mevrouw heeft niet “Misschien” blauwe ogen, ze heeft ze zeker.

    Door gebruik van het woord “zekerheid” overspeel je als onderzoeker je hand.

    • Je hebt gelijk; het kan voorkomen dat het gemiddelde niet tussen de gemeten betrouwbaarheidinterval ligt.
      Dan kun je waarschijnlijk ook direct stellen dat je steekproef niet erg representatief was voor de populatie; want dat is nou juist de bedoeling van een steekproef: proberen cijfers te achterhalen die kloppen voor de populatie.

      Door middel van een steekproef probeer je te achterhalen wat ‘waar’ is voor de populatie. ‘Waar’ zet ik tussen aanhalingstekens, omdat de waarheid niet altijd eenduidig is én wordt afgeleid van een gedeelte van de populatie (namelijk de steekproef). Idealiter zou je de hele populatie betrekken in je onderzoek, maar dat is meestal niet mogelijk (tijd, geld, bereikbaarheid).

      Vandaar ook dit stukje: “Een betrouwbaarheidsinterval wordt gebruikt om conclusies vanuit een steekproef te generaliseren naar de populatie. Alhoewel je geprobeerd hebt om zo’n representatieve steekproef als mogelijk te nemen, kan het natuurlijk altijd iets afwijken.

      Daarom wordt er een slag om de arm gehouden: 95 betrouwbaarheidsinterval wil dan ook zeggen dat de onderzoeker met 95% zeker weet dat het in de populatie tussen getal X en Z ligt.”

      Maar je hebt gelijk, ook als je steekproef zo representatief mogelijk is getrokken, kunnen de cijfers van de populatie nog altijd afwijken. Misschien is ‘zeker weet’ geen goede woordkeuze; je weet het nooit. Desalniettemin geef je aan dat er ook 5% kans is dat je fout is – en dat betekent ook dat er altijd een kans is dat de populatie er totaal anders uitziet dan je met je steekproef dacht.

  7. Hallo,

    Ik heb onderzoek gedaan naar de afnemers van een bedrijf en hun houding ten opzichte van het merk.

    Mijn populatie bestond uit 150 bedrijven, hiervan hebben 76 de enquete ingevuld. Volgens de formule zouden 109 bedrijven hem ingevuld moeten hebben voor een betrouwbaarheid van 95%. Dit is helaas niet gelukt. Ik heb via internet een tool gebruikt waarmee ik berekend heb dat de betrouwbaarheid van mijn onderzoek 78% is. Wat betekent dit voor de bruikbaarheid van mijn resultaten?

    Ik hoor graag van u want ik loop hierop vast en moet donderdag tijdens mijn verdediging uit kunnen leggen wat de gevolgen zijn.

    Alvast hartelijk bedankt!

    Met vriendelijke groet,
    Emma

  8. Vraagje. In het antwoordmodel staat het volgende over de volgende formule:

    n > (z/a)2 x .p.q.

    ”Er staat dat het betrouwbaarheidsinterval maximaal 6% breed moet zijn, dus de afwijking a is maximaal 3%”.

    Hoezo wordt dit opeens gehalveerd? Ik zie de logica ervan niet in. Ik kon geen screenshot plaatsen van de SPSS tabel, maar hoop dat het duidelijk is.

    • Je vraag is me niet helemaal duidelijk, maar misschien dat onderstaande al enigszins opheldering biedt.

      De betrouwbaarheidsinterval geeft aan hoeveel procent tussen welke waarden ligt. Bijvoorbeeld bij een 95% betrouwbaarheidsinterval liggen 95% van de waarden tussen 11 en 14 (cijfers zijn een voorbeeld, kan per keer verschillen). Dat betekent dat er 5% van de waarden afwijkt – 2,5% aan de linkerkant (onder 11) en 2,5% aan de rechterkant (boven 14). Zo wordt de alfa (5% in dit geval) dus gehalveerd en wijkt het 2,5% naar beneden en 2,5% naar boven af.

      Is dit geen antwoord op je vraag? Laat het me dan even weten. Wil je dan ook even de betekenis van de letters uit in de formule uitleggen? (dan ben ik zeker dat we over hetzelfde praten). Misschien kun je dan ook iets meer achtergrond informatie geven. Of stuur me even een mail, dan kun je wel een scan als bijlage plaatsen.

  9. Zijn er bepaalde richtlijnen voor de selectie van een betrouwbaarheidsinterval ? Moet het onderzoek dus aan bepaalde voorwaarden voldoen om het betrouwbaarheidsniveau van 90% toe te mogen passen ?

    • Hoi Tina,
      De vaststelling van het betrouwbaarheidspercentage zijn min of meer keuze van de onderzoeker. Het meest gangbaar zijn 95% en 99%. Bedenk dat als je voor 90% kiest, dat je interval dan kleiner wordt, maar dat de kans dat je mis zit 10% is. Deze foutkans wordt kleiner naarmate je een hoger betrouwbaarheidspercentage kiest, zoals 95% of 99%. Nadeel daarvan is weer dat je interval groter wordt. Bijvoorbeeld:
      – Met 90% zekerheid kan ik zeggen dat het gemiddelde tussen 5 en 7 ligt.
      – Met 95% zekerheid kan ik zeggen dat het gemiddelde tussen 4 en 8 ligt.
      – Met 99% zekerheid kan ik zeggen dat het gemiddelde tussen 3 en 9 ligt.

      Het ligt er dus mede aan hoe specifiek je wil zijn en in hoeverre je een slag om de arm wil houden. Hoe specifieker je wil zijn, hoe lager je betrouwbaarheidspercentage.

      (Vergelijk het met het weer: ik kan met 100% zekerheid zeggen dat morgen de temperatuur ergens tussen de -50 en +50 graden wordt. Maar ik moet aan zekerheid inleveren als ik het specifieker wil maken; ik kan bijvoorbeeld met 80% zekerheid zeggen dat het tussen de 0-20 graden wordt.)

  10. Leuk! Het verhaal is tenminste leesbaar voor een leek- veel statistiekboeken ervaar ik als gortdroog en niet te volgen.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *