Skillnaden mellan linjär och logistisk regression

Skillnaden mellan linjär och logistisk regression
Skillnaden mellan linjär och logistisk regression

Video: Skillnaden mellan linjär och logistisk regression

Video: Skillnaden mellan linjär och logistisk regression
Video: Lukujonon luetteleminen 2024, November
Anonim

Linjär vs logistisk regression

I statistisk analys är det viktigt att identifiera sambanden mellan variabler som berörs av studien. Ibland kan det vara det enda syftet med själva analysen. Ett starkt verktyg som används för att fastställa existensen av ett samband och identifiera sambandet är regressionsanalys.

Den enklaste formen av regressionsanalys är linjär regression, där relationen mellan variablerna är ett linjärt samband. I statistiska termer tar den fram sambandet mellan förklaringsvariabeln och svarsvariabeln. Med hjälp av regression kan vi till exempel fastställa sambandet mellan råvarupriset och konsumtionen baserat på data som samlats in från ett slumpmässigt urval. Regressionsanalys kommer att producera en regressionsfunktion av datamängden, vilket är en matematisk modell som bäst passar de tillgängliga data. Detta kan lätt representeras av ett spridningsdiagram. Grafiskt sett motsvarar regression att hitta den bästa passande kurvan för den givna datamängden. Kurvans funktion är regressionsfunktionen. Med hjälp av den matematiska modellen kan användningen av en vara förutsägas för ett givet pris.

Regressionsanalysen används därför i stor utsträckning för att förutsäga och prognostisera. Det används också för att fastställa sambanden i experimentella data, inom fysik, kemi och inom många naturvetenskapliga och tekniska discipliner. Om förhållandet eller regressionsfunktionen är en linjär funktion, är processen känd som en linjär regression. I spridningsdiagrammet kan det representeras som en rak linje. Om funktionen inte är en linjär kombination av parametrarna är regressionen icke-linjär.

Logistisk regression är jämförbar med multivariat regression, och den skapar en modell för att förklara effekten av flera prediktorer på en svarsvariabel. Men vid logistisk regression bör slutresultatvariabeln vara kategorisk (vanligtvis uppdelad, dvs. ett par uppnåbara resultat, som död eller överlevnad, även om speciella tekniker gör det möjligt att modellera mer kategoriserad information). En kontinuerlig utfallsvariabel kan omvandlas till en kategorisk variabel för att användas för logistisk regression; Men att kollapsa kontinuerliga variabler på detta sätt avråds oftast eftersom det minskar noggrannheten.

Till skillnad från den linjära regressionen, mot medelvärdet, behöver inte prediktorvariablerna i logistisk regression vara tvingade att vara linjärt sammankopplade, gemensamt fördelade eller ha lika stor varians i varje kluster. Som ett resultat är förhållandet mellan prediktorn och utfallsvariablerna sannolikt inte en linjär funktion.

Vad är skillnaden mellan logistisk och linjär regression?

• I linjär regression antas ett linjärt samband mellan förklaringsvariabeln och svarsvariabeln och parametrar som uppfyller modellen hittas genom analys, för att ge det exakta sambandet.

• Linjär regression utförs för kvantitativa variabler, och den resulterande funktionen är en kvantitativ.

• I den logistiska regressionen kan data som används vara antingen kategoriska eller kvantitativa, men resultatet är alltid kategoriskt.

Rekommenderad: