Skillnaden mellan regression och korrelation

Skillnaden mellan regression och korrelation
Skillnaden mellan regression och korrelation

Video: Skillnaden mellan regression och korrelation

Video: Skillnaden mellan regression och korrelation
Video: The 4 Nucleotide Bases: Guanine, Cytosine, Adenine, and Thymine | What Are Purines and Pyrimidines 2024, Juli
Anonim

Regression vs Correlation

I statistik är det viktigt att fastställa sambandet mellan två slumpvariabler. Det ger möjlighet att göra förutsägelser om en variabel i förhållande till andra. Regressionsanalys och korrelation används i väderprognoser, beteende på finansmarknaden, etablering av fysiska relationer genom experiment och i mycket mer verkliga scenarier.

Vad är regression?

Regression är en statistisk metod som används för att rita sambandet mellan två variabler. När data samlas in kan det ofta finnas variabler som är beroende av andra. Det exakta sambandet mellan dessa variabler kan endast fastställas med regressionsmetoderna. Att fastställa detta förhållande hjälper till att förstå och förutsäga beteendet hos en variabel till den andra.

Den vanligaste tillämpningen av regressionsanalysen är att uppskatta värdet av den beroende variabeln för ett givet värde eller värdeintervall för de oberoende variablerna. Med hjälp av regression kan vi till exempel fastställa sambandet mellan råvarupriset och konsumtionen, baserat på data som samlats in från ett slumpmässigt urval. Regressionsanalys producerar regressionsfunktionen för en datamängd, vilket är en matematisk modell som bäst passar till tillgänglig data. Detta kan lätt representeras av ett spridningsdiagram. Grafiskt sett motsvarar regression att hitta den bästa passande kurvan för den givna datamängden. Kurvans funktion är regressionsfunktionen. Med hjälp av den matematiska modellen kan efterfrågan på en vara förutsägas för ett givet pris.

Regressionsanalysen används därför i stor utsträckning för att förutsäga och prognostisera. Det används också för att etablera relationer i experimentella data, inom fysik, kemi och många naturvetenskapliga och tekniska discipliner. Om förhållandet eller regressionsfunktionen är en linjär funktion, är processen känd som en linjär regression. I spridningsdiagrammet kan det representeras som en rak linje. Om funktionen inte är en linjär kombination av parametrarna är regressionen icke-linjär.

Vad är korrelation?

Korrelation är ett mått på styrkan av sambandet mellan två variabler. Korrelationskoefficienten kvantifierar graden av förändring i en variabel baserat på förändringen i den andra variabeln. I statistik är korrelation kopplad till begreppet beroende, som är det statistiska sambandet mellan två variabler.

Pearsons korrelationskoefficient eller bara korrelationskoefficienten r är ett värde mellan -1 och 1 (-1≤r≤+1). Det är den vanligaste korrelationskoefficienten och giltig endast för ett linjärt samband mellan variablerna. Om r=0 finns inget samband, och om r≥0 är sambandet direkt proportionellt; dvs värdet av en variabel ökar med ökningen av den andra. Om r≤0 är förhållandet omvänt proportionellt; d.v.s. en variabel minskar när den andra ökar.

På grund av linjäritetsvillkoret kan korrelationskoefficienten r också användas för att fastställa närvaron av ett linjärt samband mellan variablerna.

Vad är skillnaden mellan regression och korrelation?

Regression ger formen av sambandet mellan två slumpvariabler, och korrelationen anger graden av styrka av sambandet.

Regressionsanalys producerar en regressionsfunktion, som hjälper till att extrapolera och förutsäga resultat medan korrelation endast kan ge information om vilken riktning den kan ändras.

De mer exakta linjära regressionsmodellerna ges av analysen, om korrelationskoefficienten är högre. (|r|≥0,8)

Rekommenderad: