Korrelation vs Kovarians
Korrelation och kovarians är närbesläktade begrepp i teoretisk statistik. De är viktiga för att bestämma sambandet mellan två slumpvariabler.
Vad är korrelation?
Korrelation är ett mått på styrkan i sambandet mellan två variabler. Korrelationskoefficienten kvantifierar graden av förändring av en variabel baserat på förändringen av den andra variabeln. Inom statistik är korrelation kopplad till begreppet beroende, som är det statistiska sambandet mellan två variabler
Pearsons korrelationskoefficient eller bara korrelationskoefficienten r är ett värde mellan -1 och 1 (-1≤r≤+1). Det är den vanligaste korrelationskoefficienten och giltig endast för ett linjärt samband mellan variablerna. Om r=0 finns inget samband, och om r≥0 är sambandet direkt proportionellt; värdet av en variabel ökar med ökningen av den andra. Om r≤0 är förhållandet omvänt proportionellt; en variabel minskar när den andra ökar.
På grund av linjäritetsvillkoret kan korrelationskoefficienten r också användas för att fastställa närvaron av ett linjärt samband mellan variablerna.
Vad är kovarians?
I statistisk teori är kovarians ett mått på hur mycket två slumpvariabler förändras tillsammans. Med andra ord är kovarians ett mått på styrkan av korrelationen mellan två slumpvariabler.
I ett annat perspektiv kan man se att korrelation bara är den normaliserade versionen av kovarians, där kovariansen divideras med produkten av standardavvikelserna för de två slumpvariablerna. Omfånget av kovarians kan vara stort; därför är det inte lätt att jämföra. Denna svårighet övervinns genom att bringa kovariansvärdena till ett område där det kan jämföras genom att normalisera det (ungefär som vad z-score gör). Även om kovariansen och variansen är kopplade till varandra på ovanstående sätt, är deras sannolikhetsfördelningar inte kopplade till varandra på ett enkelt sätt och måste behandlas separat.
Vad är skillnaden mellan korrelation och kovarians?
• Både korrelation och kovarians är mått på relationen mellan två stokastiska variabler. Korrelation är ett mått på styrkan av de två variablernas linjäritet och kovarians är ett mått på styrkan hos korrelationen.
• Korrelationskoefficientvärden är ett värde mellan -1 och +1, medan kovariansintervallet inte är konstant, utan kan antingen vara positivt eller negativt. Men om de slumpmässiga variablerna är standardiserade innan kovariansen beräknas så är kovariansen lika med korrelationen och har ett värde mellan -1 och +1.