Steekproef
Uit Wikipedia, de vrije encyclopedie
Een steekproef of monster, een statistisch begrip, is een selectie uit een totale populatie ten behoeve van een meting van bepaalde eigenschappen van die populatie. In het dagelijkse spraakgebruik kan een monster ook een voorbeeld van één individu uit een populatie betekenen.
De term steekproef is afkomstig van het Duitse Stichprobe dat werd gebruikt voor een monster uit het vloeibare metaal in een hoogoven. Ook werd het gebruikt voor een monster uit een ongeopende zak graan met een speciaal instrument dat de zak niet beschadigde. Op de kaasmarkt is de letterlijke steekproef als de keurmeester een kaasboor in de kaas steekt om uit het midden van de kaas een stukje te keuren (proeven).
De keuze voor een meting met behulp van een steekproef in plaats van de totale populatie wordt bepaald door de volgende overwegingen:
- bij een populatie van grote omvang is het praktisch ondoenlijk alle elementen te meten
- als de metingen kostbaar zijn, kan slechts een beperkt aantal metingen worden gedaan
- bij destructief onderzoek zou de hele populatie verloren gaan
- als snelheid gewenst is, kan niet de hele populatie onderzocht worden
- als er geen al te grote nauwkeurigheid verlangd is, kan met een steekproef worden volstaan
- het is gemakkelijker slechts een deel van de populatie te onderzoeken.
Soorten steekproef
Men kan op verschillende manieren een steekproef verkrijgen.
Aselecte steekproef
Als alle elementen uit de populatie dezelfde kans hebben om in de steekproef te worden opgenomen, dan is het een aselecte steekproef.
Selecte steekproef
Bij een selecte steekproef worden de elementen niet op toevalsbasis uit een populatie genomen.
Representatieve steekproef
Als de populatie ten aanzien van een bepaald kenmerk is gepartitioneerd in een aantal klassen (categorieën, lagen), dan wordt in een representatieve steekproef ervoor gezorgd dat deze klassen in dezelfde verhouding in de steekproef vertegenwoordigd zijn als in de populatie. Zo is een steekproef representatief wat het kenmerk geslacht betreft als de verhouding waarin mannen en vrouwen in de steekproef voorkomen ongeveer gelijk is aan de verhouding in de bevolking. De keuze bepaalt in grote mate de validiteit van verdere analyse.
Quotasteekproef
Een quotasteekproef is een vorm van representatieve steekproef. De aantallen voor de te representeren categorieën, de quota, worden vooraf bepaald, maar het wordt aan degenen die daadwerkelijk de steekproef uitvoeren, overgelaten de elementen zelf te kiezen, als de gewenste quota maar gehaald worden.
Gelaagde of gestratificeerde steekproef
Als de populatie ten aanzien van een bepaald kenmerk is verdeeld in een aantal klassen (categorieën, lagen), dan is de steekproef gelaagd of gestratificeerd als de steekproef gevormd wordt door steekproeven uit elk van de klassen. Een voorbeeld hiervan is een steekproef waarbij uit elke klas (de categorieën) van een basisschool 3 leerlingen worden gekozen.
Clustersteekproef
Clusters zijn verdelingen van de populatie in een aantal vergelijkbare deelpopulaties. Bij een clustersteekproef wordt een aselecte steekproef uit de clusters getrokken en worden vervolgens alle elementen van de geselecteerde clusters in de steekproef opgenomen. Een voorbeeld van een clustersteekproef is het onderzoeken van de teamleden van 3 van de 20 sportteams van een sportclub. Hierbij zijn dus alle elementen (de sporters) van de 3 deelpopulaties (sportteams) uit de gehele populatie (de sportclub) gekozen.
Systematische steekproef
In een systematische steekproef worden de elementen die in de steekproef worden opgenomen, op systematische wijze bepaald. Zo kan als systeem gehanteerd worden dat elke tiende voorbijganger ondervraagd wordt, tot het gewenste aantal bereikt is.
Gemakssteekproef
In een gemakssteekproef worden de elementen die in de steekproef worden opgenomen, gekozen uit een voor de hand liggend, gemakkelijk toegankelijk deel van de populatie.
Sneeuwbalsteekproef
In gevallen waarin de elementen van de populatie moeilijk bereikbaar zijn, wordt wel een volgend element in de steekproef aangewezen of bepaald door een vorig element, waardoor een soort sneeuwbaleffect ontstaat. Een op deze wijze verkregen steekproef is een sneeuwbalsteekproef.
Voorbeelden
Een fraai voorbeeld van een steekproef in materiële en statistische zin is (was) te zien tijdens de suikerbietencampagne in Noord-Holland. De bieten worden, nadat ze gerooid zijn, met vrachtwagens naar een schip gebracht om verder naar de fabriek vervoerd te worden. Omdat de vrachtwagens bieten van verschillende bedrijven aanvoeren, wordt elke vrachtwagen zowel voor als na het lossen gewogen, maar tevens wordt met een groot apparaat van elke vrachtwagen letterlijk een steekproef genomen op een willekeurige plaats in de lading om de kwaliteit vast te stellen.
Bij een ander voorbeeld kan bij een steekproef van 1000 beurzen worden geteld hoeveel buitenlandse euromuntjes erin zitten. Op grond daarvan kan dan geschat worden hoeveel vreemde euromuntjes er in het hele land (populatie) in omloop zijn. Een schatting heeft altijd een foutenmarge die afhangt van de wijze van trekken van de steekproef. Als er relatief veel beurzen uit grensgemeenten in de steekproef worden opgenomen, dan is deze niet representatief, met als gevolg een vertekende uitkomst.
Variabiliteit bij steekproeven
Doordat iedere steekproef uit andere elementen van de populatie kan bestaan, verschillen de uitkomsten gewoonlijk van elkaar, de variabiliteit bij steekproeven.
Schatters
De manier van verwerking van de resultaten van een steekproef is een schatter. De keuze voor een schatter hangt af van de te verwachten eigenaardigheden van de kansverdeling in een populatie en van de eigenschap van de te onderzoeken populatie. De meest gangbare schatters zijn:
- het rekenkundig gemiddelde (de som van de waargenomen waarden gedeeld door het aantal waarnemingen)
- de mediaan (de middelste waarde uit de op waarde gesorteerde reeks waarnemingen)
- de modale waarde (de waarde met de meeste voorkomens in een reeks waarnemingen)
Daarnaast zijn er schatters voor de spreiding en voor de scheefheid van de steekproef.
Vertekening
Als bepaalde uitkomsten, gewild of ongewild, systematisch worden bevoordeeld, dan is er sprake van een vertekening. Zo was er in de tijd dat nog lang niet iedereen een telefoon had bij telefonische enquêtes een sterke vertekening.
Uitbijters
Het resultaat van de steekproef kan uitbijters bevatten; dit zijn waarnemingen die sterk afwijken van hetgeen verwacht wordt. Er dient dan te worden bekeken wat de oorzaken (kunnen) zijn van deze uitbijters. Als er redenen zijn om aan te nemen dat deze gegevens (data) niet te vertrouwen is (bijv. een typefout bij de gegevens-invoer; leeftijd van 131 jaar in plaats van 31 jaar) kan er voor worden gekozen deze gegevens te verwijderen. Echter, als deze redenen ontbreken is het aan te raden de gegevens twee keer te analyseren: een keer met de uitbijters én een keer zonder. Op deze manier kan de invloed van de uitbijter(s) in kaart worden gebracht en worden bediscussieerd.
Text is available under the CC BY-SA 4.0 license; additional terms may apply.
Images, videos and audio are available under their respective licenses.