Varians vs Covariance
Varians och kovarians är två mått som används i statistik. Varians är ett mått på spridningen av data, och kovarians indikerar graden av förändring av två slumpmässiga variabler tillsammans. Varians är snarare ett intuitivt koncept, men kovarians definieras matematiskt på ett inte så intuitivt sätt till en början.
Mer om Variance
Varians är ett mått på spridningen av data från medelvärdet för fördelningen. Den berättar hur långt datapunkterna ligger från medelvärdet av fördelningen. Det är en av de primära deskriptorerna för sannolikhetsfördelningen och ett av fördelningens moment. Varians är också en parameter för populationen, och variansen för ett urval från populationen fungerar som en estimator för variansen i populationen. Ur ett perspektiv definieras det som kvadraten på standardavvikelsen.
I klarspråk kan det beskrivas som medelvärdet av kvadraterna på avståndet mellan varje datapunkt och medelvärdet av fördelningen. Följande formel används för att beräkna variansen.
Var(X)=E[(X-µ)2] för en befolkning, och
Var(X)=E[(X-‾x)2] för ett exempel
Det kan ytterligare förenklas att ge Var(X)=E[X2]-(E[X])2.
Variance har vissa signaturegenskaper och används ofta i statistik för att göra användningen enklare. Varians är icke-negativ eftersom det är kvadraten på avstånden. Variansens intervall är dock inte begränsat och beror på den specifika fördelningen. Variansen för en konstant slumpvariabel är noll, och variansen ändras inte med avseende på en platsparameter.
Mer om kovarians
I statistisk teori är kovarians ett mått på hur mycket två slumpvariabler förändras tillsammans. Med andra ord är kovarians ett mått på styrkan av korrelationen mellan två slumpvariabler. Det kan också betraktas som en generalisering av begreppet varians för två slumpvariabler.
Kovarians för två stokastiska variabler X och Y, som är gemensamt fördelade med ändligt sekundär momentum, är känd som σXY=E[(X-E[X])(Y-E[Y])]. Av detta kan varians ses som ett specialfall av kovarians, där två variabler är lika. Cov(X, X)=Var(X)
Genom att normalisera kovariansen kan den linjära korrelationskoefficienten eller Pearsons korrelationskoefficient erhållas, vilken definieras som ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
Grafiskt sett kan kovarians mellan ett par datapunkter ses som arean av rektangeln med datapunkterna vid motsatta hörn. Det kan tolkas som ett mått på storleken på separationen mellan de två datapunkterna. Med tanke på rektanglarna för hela populationen kan överlappningen av rektanglarna som motsvarar alla datapunkter betraktas som styrkan av separationen; variansen av de två variablerna. Kovarians är i två dimensioner, på grund av två variabler, men att förenkla den till en variabel ger variansen för en singel som separationen i en dimension.
Vad är skillnaden mellan Varians och Kovarians?
• Varians är måttet på spridning/spridning i en population medan kovarians betraktas som ett mått på variation av två slumpvariabler eller styrkan på korrelationen.
• Varians kan betraktas som ett specialfall av kovarians.
• Varians och kovarians är beroende av storleken på datavärdena och kan inte jämföras; därför är de normaliserade. Kovarians normaliseras till korrelationskoefficienten (dividerande med produkten av standardavvikelserna för de två slumpvariablerna) och variansen normaliseras till standardavvikelsen (genom att ta kvadratroten)