Dispersion vs Skewness
I statistik och sannolikhetsteori måste variationen i fördelningarna ofta uttryckas på ett kvantitativt sätt för jämförelsesyften. Dispersion och Skewness är två statistiska begrepp där fördelningens form presenteras i en kvantitativ skala.
Mer om Dispersion
I statistik är spridningen variationen av en slumpvariabel eller dess sannolikhetsfördelning. Det är ett mått på hur långt datapunkterna ligger från det centrala värdet. För att uttrycka detta kvantitativt används spridningsmått i beskrivande statistik.
Varians, standardavvikelse och interkvartilintervall är de vanligaste måtten på spridning.
Om datavärdena har en viss enhet, på grund av skalan, kan spridningsmåtten också ha samma enheter. Interdecilområde, Range, medelskillnad, median absolut avvikelse, genomsnittlig absolut avvikelse och avståndsstandardavvikelse är mått på spridning med enheter.
Däremot finns det spridningsmått som inte har några enheter, det vill säga dimensionslösa. Varians, variationskoefficient, kvartil spridningskoefficient och relativ medelskillnad är mått på spridning utan enheter.
Dispersion i ett system kan härröra från fel, såsom instrumentella och observationsfel. Dessutom kan slumpmässiga variationer i själva urvalet orsaka variationer. Det är viktigt att ha en kvantitativ uppfattning om variationen i data innan man drar andra slutsatser från datamängden.
Mer om Skewness
I statistik är skevhet ett mått på asymmetri i sannolikhetsfördelningarna. Skevhet kan vara positiv eller negativ, eller i vissa fall obefintlig. Det kan också betraktas som ett mått på offset från normalfördelningen.
Om skevheten är positiv centreras huvuddelen av datapunkterna till vänster om kurvan och den högra svansen är längre. Om skevheten är negativ centreras huvuddelen av datapunkterna mot höger om kurvan och den vänstra svansen är ganska lång. Om skevheten är noll är populationen normalfördelad.
I en normalfördelning, det vill säga när kurvan är symmetrisk, har medelvärdet, medianen och läget samma värde. Om skevheten inte är noll, gäller inte den här egenskapen, och medelvärdet, läget och medianen kan ha olika värden.
Pearsons första och andra skevhetskoefficienter används vanligtvis för att bestämma skevheten i fördelningarna.
Pearson's first skewness coffeicent=(medelvärde – läge) / (standardavvikelse)
Pearsons andra skevhetskoffeicent=3(medelvärde – läge) / (satndard avvikelse)
I mer känsliga fall används justerad Fisher-Pearson standardiserad momentkoefficient.
G={n / (n-1)(n-2)} ∑i=1 ((y-ӯ)/s)3
Vad är skillnaden mellan dispersion och skevhet?
Spredningen är orolig för intervallet över vilket datapunkterna är fördelade, och skevheten gäller fördelningens symmetri.
Båda måtten på spridning och skevhet är beskrivande mått och skevhetskoefficient ger en indikation på fördelningens form.
Spredningsmått används för att förstå datapunkternas omfång och förskjutning från medelvärdet medan skevhet används för att förstå tendensen för variationen av datapunkter i en viss riktning.