Population vs Sample Standard Deviation
I statistik används flera index för att beskriva en datamängd som motsvarar dess centrala tendens, spridning och skevhet. Standardavvikelse är ett av de vanligaste måtten på spridning av data från mitten av datamängden.
På grund av praktiska svårigheter kommer det inte att vara möjligt att använda data från hela populationen när en hypotes testas. Därför använder vi datavärden från urval för att dra slutsatser om populationen. I en sådan situation kallas dessa estimatorer eftersom de uppskattar populationsparametervärdena.
Det är oerhört viktigt att använda opartiska skattare för slutledning. En estimator sägs vara opartisk om det förväntade värdet för den estimatorn är lika med populationsparametern. Till exempel använder vi urvalets medelvärde som en opartisk skattare för populationsmedelvärdet. (Matematiskt kan det visas att det förväntade värdet av urvalsmedelvärdet är lika med populationsmedelvärdet). När det gäller att uppskatta populationens standardavvikelse är urvalets standardavvikelse också en opartisk skattare.
Vad är populationens standardavvikelse?
När data från hela populationen kan tas med i beräkningen (till exempel vid en folkräkning) är det möjligt att beräkna populationens standardavvikelse. För att beräkna standardavvikelsen för populationen beräknas först avvikelserna för datavärden från populationsmedelvärdet. Rotmedelvärdet (kvadratiskt medelvärde) av avvikelser kallas populationens standardavvikelse.
I en klass med 10 elever kan data om eleverna enkelt samlas in. Om en hypotes testas på denna population av elever finns det inget behov av att använda urvalsvärden. Till exempel mäts vikterna för de 10 eleverna (i kilogram) till 70, 62, 65, 72, 80, 70, 63, 72, 77 och 79. Då är medelvikten för de tio personerna (i kilogram) (70+62+65+72+80+70+63+72+77+79)/10, vilket är 71 (i kilogram). Det här är befolkningens medelvärde.
Nu för att beräkna populationens standardavvikelse, beräknar vi avvikelser från medelvärdet. De respektive avvikelserna från medelvärdet är (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 och (79 – 71)=8. Summan av kvadraterna av avvikelsen är (-1)2 + (-9)2 + (-6)2 + 1 2 + 92 + (-1)2 + (-8)2+ 12 + 62 + 82 =366. Populationens standardavvikelse är √(366/10)=6,05 (i kilogram). 71 är den exakta medelvikten för eleverna i klassen och 6.05 är den exakta standardavvikelsen för vikten från 71.
Vad är exempel på standardavvikelse?
När data från ett urval (av storlek n) används för att uppskatta parametrar för populationen, beräknas urvalets standardavvikelse. Först beräknas avvikelserna för datavärden från provmedelvärdet. Eftersom urvalsmedelvärdet används i stället för populationsmedelvärdet (vilket är okänt), är det inte lämpligt att ta det kvadratiska medelvärdet. För att kompensera för användningen av urvalsmedelvärde divideras summan av kvadrater av avvikelser med (n-1) istället för n. Provets standardavvikelse är kvadratroten av detta. I matematiska symboler är S=√{∑(xi-ẍ)2 / (n-1)}, där S är provets standardavvikelse, ẍ är provmedelvärdet och xi är datapunkterna.
Antag nu att befolkningen i det föregående exemplet är eleverna på hela skolan. Då blir klassen bara ett exempel. Om detta prov används i uppskattningen kommer provets standardavvikelse att vara √(366/9)=6.38 (i kilogram) eftersom 366 delades med 9 istället för 10 (provstorleken). Faktum att observera är att detta inte garanteras vara det exakta populationens standardavvikelsevärde. Det är bara en uppskattning för det.
Vad är skillnaden mellan populationens standardavvikelse och urvalets standardavvikelse?
• Populationsstandardavvikelse är det exakta parametervärde som används för att mäta spridningen från mitten, medan urvalets standardavvikelse är en opartisk estimator för det.
• Populationens standardavvikelse beräknas när all data om varje individ i populationen är känd. Annars beräknas provets standardavvikelse.
• Populationens standardavvikelse ges av σ=√{ ∑(xi-µ)2/ n} där µ är populationens medelvärde och n är populationens storlek men provets standardavvikelse ges av S=√{ ∑(xi-ẍ)2 / (n-1)} där ẍ är urvalets medelvärde och n är urvalets storlek.