Slumpmässiga variabler kontra sannolikhetsfördelning
Statistiska experiment är slumpmässiga experiment som kan upprepas i all oändlighet med en känd uppsättning resultat. Både slumpvariabler och sannolikhetsfördelningar är associerade med sådana experiment. För varje slumpvariabel finns det en associerad sannolikhetsfördelning definierad av en funktion som kallas kumulativ fördelningsfunktion.
Vad är en slumpvariabel?
En slumpvariabel är en funktion som tilldelar numeriska värden till resultaten av ett statistiskt experiment. Det är med andra ord en funktion som definieras från sampelutrymmet för ett statistiskt experiment till uppsättningen av reella tal.
Tänk till exempel på ett slumpmässigt experiment med att vända ett mynt två gånger. De möjliga utfallen är HH, HT, TH och TT (H – huvuden, T – berättelser). Låt variabeln X vara antalet huvuden som observerats i experimentet. Sedan kan X ta värdena 0, 1 eller 2, och det är en slumpvariabel. Här kommer den slumpmässiga variabeln X att mappa mängden S={HH, HT, TH, TT} (sampelutrymmet) till mängden {0, 1, 2} på ett sådant sätt att HH mappas till 2, HT och TH mappas till 1 och TT mappas till 0. I funktionsnotation kan detta skrivas som, X: S → R där X(HH)=2, X(HT)=1, X(TH)=1 och X(TT)=0.
Det finns två typer av slumpvariabler: diskreta och kontinuerliga, följaktligen är antalet möjliga värden som en slumpvariabel kan anta högst räknat eller inte. I föregående exempel är den slumpmässiga variabeln X en diskret slumpvariabel eftersom {0, 1, 2} är en ändlig mängd. Tänk nu på det statistiska experimentet att hitta vikterna för elever i en klass. Låt Y vara den slumpmässiga variabeln definierad som vikten av en elev. Y kan ta vilket verkligt värde som helst inom ett specifikt intervall. Därför är Y en kontinuerlig slumpvariabel.
Vad är en sannolikhetsfördelning?
Sannolikhetsfördelning är en funktion som beskriver sannolikheten för att en slumpvariabel tar vissa värden.
En funktion som kallas kumulativ fördelningsfunktion (F) kan definieras från mängden reella tal till mängden reella tal som F(x)=P(X ≤ x) (sannolikheten att X är mindre än eller lika med x) för varje möjligt utfall x. Nu kan den kumulativa fördelningsfunktionen för X i det första exemplet skrivas som F(a)=0, om a<0; F(a)=0,25, om 0≤a<1; F(a)=0,75, om 1≤a<2 och F(a)=1, om a≥2.
I fall av diskreta slumpvariabler kan en funktion definieras från mängden möjliga utfall till mängden reella tal på ett sådant sätt att ƒ(x)=P(X=x) (sannolikheten för X) är lika med x) för varje möjligt utfall x. Denna speciella funktion ƒ kallas sannolikhetsmassfunktionen för den slumpmässiga variabeln X. Nu kan sannolikhetsmassfunktionen för X i det första exemplet skrivas som ƒ(0)=0,25, ƒ(1)=0,5, ƒ(2)=0,25 och ƒ(x)=0 annars. Således kommer sannolikhetsmassfunktionen tillsammans med den kumulativa fördelningsfunktionen att beskriva sannolikhetsfördelningen av X i det första exemplet.
I fallet med kontinuerliga slumpvariabler kan en funktion som kallas sannolikhetstäthetsfunktionen (ƒ) definieras som ƒ(x)=dF(x)/dx för varje x där F är den kumulativa fördelningsfunktionen för kontinuerlig slumpvariabel. Det är lätt att se att denna funktion uppfyller ∫ƒ(x)dx=1. Sannolikhetstäthetsfunktionen tillsammans med den kumulativa fördelningsfunktionen beskriver sannolikhetsfördelningen för en kontinuerlig stokastisk variabel. Till exempel beskrivs normalfördelningen (som är en kontinuerlig sannolikhetsfördelning) med hjälp av sannolikhetstäthetsfunktionen ƒ(x)=1/√(2πσ2) e^([(x-) µ)]2/(2σ2)).
Vad är skillnaden mellan slumpmässiga variabler och sannolikhetsfördelning?
• Slumpvariabel är en funktion som associerar värden i ett sampelutrymme till ett reellt tal.
• Sannolikhetsfördelning är en funktion som associerar värden som en slumpvariabel kan ta till respektive sannolikhet för att inträffa.