Stratifierad sampling vs klustersampling
I statistik, särskilt när man genomför undersökningar, är det viktigt att få ett opartiskt urval, så att resultatet och de förutsägelser som görs om populationen blir mer korrekta. Men i det enkla slumpmässiga urvalet finns möjligheten att välja de medlemmar av urvalet som är partisk; med andra ord, det representerar inte befolkningen rättvist. Därför används stratifierad sampling och klusterprovtagning för att övervinna bias och effektivitetsproblem med det enkla slumpmässiga urvalet.
Stratifierad sampling
Stratifierat slumpmässigt urval är en urvalsmetod där populationen först delas in i strata (Ett stratum är en homogen delmängd av populationen). Sedan tas ett enkelt stickprov från varje stratum. Resultaten från varje kombinerat strata utgör provet. Följande är exempel på möjliga skikt i populationer
• För en befolkning i en stat, manliga och kvinnliga skikt
• För personer som arbetar i en stad, bosatta och utländska skikt
• För studenter i en högskola, vita, svarta, latinamerikanska och asiatiska skikt
• För en publik av en debatt om teologi, protestantiska, katolska, judiska, muslimska skikt
I denna process, istället för att ta stickprov direkt från populationen, separeras populationen i grupper med hjälp av en inneboende egenskap hos elementen (homogena grupper). Sedan tas stickprov från gruppen. Mängden slumpmässiga urval som tas från varje grupp beror på antalet element i gruppen.
Detta gör att sampling kan göras utan att urvalet för en grupp är större än antalet prover som krävs från den specifika gruppen. Om antalet element från en viss grupp är större än det erforderliga beloppet kan en skev distribution leda till felaktiga tolkningar.
Stratifierad sampling möjliggör användning av olika statistiska metoder för varje stratum, vilket hjälper till att förbättra effektiviteten och noggrannheten i uppskattningen.
Cluster Sampling
Klusterslumpurval är en urvalsmetod där populationen först delas in i kluster (Ett kluster är en heterogen delmängd av populationen). Sedan tas ett enkelt slumpmässigt urval av kluster. Alla medlemmar i de valda klustren utgör tillsammans urvalet. Den här metoden används ofta när naturliga grupperingar är uppenbara och tillgängliga.
Tänk till exempel på en undersökning för att utvärdera gymnasieelevers engagemang i fritidsaktiviteter. Istället för att välja slumpmässiga elever från elevpopulationen är det klusterurval att välja en klass som urval för undersökningen. Sedan intervjuas varje medlem i klassen. I det här fallet är klasserna kluster av studentpopulationen.
I klustersampling är det klustren som väljs slumpmässigt, inte individerna. Det antas att varje kluster i sig är en opartisk representation av befolkningen, vilket innebär att vart och ett av klustren är heterogent.
Vad är skillnaden mellan Stratifierad Sampling och Cluster Sampling?
• I stratifierad provtagning delas populationen in i homogena grupper som kallas strata, med hjälp av ett attribut för urvalen. Sedan väljs medlemmar från varje stratum, och antalet prover som tas från dessa strata är proportionell mot förekomsten av strata i populationen.
• Vid klusterurval grupperas populationen i kluster, huvudsakligen baserat på plats, och sedan väljs ett kluster slumpmässigt.
• Vid klusterurval väljs ett kluster slumpmässigt, medan i stratifierat urval väljs medlemmar slumpmässigt.
• I stratifierad sampling inkluderar varje grupp som används (strata) homogena medlemmar medan ett kluster är heterogent i klusterprovtagning.
• Stratifierad sampling är långsammare medan kluster-sampling är relativt snabbare.
• Stratifierade urval har mindre fel på grund av att varje grupp i populationen tar hänsyn till närvaron av varje grupp och anpassar metoderna för att få en bättre uppskattning.
• Klustersampling har en inneboende högre procentandel av fel.