Zmienne losowe
Dla określenia zmiennej losowej potrzebna jest znajomość tzw. trójki probabilistycznej. Załóżmy, że dana jest przestrzeń probabilistyczna (E, S, P).
Zmienną losową X nazywamy funkcję rzeczywistą określoną na przestrzeni zdarzeń elementarnych E i mierzalną względem ciała zdarzeń S: ,która każdemu zdarzeniu elementarnemu eE przyporządkowuje liczbę rzeczywistą X(e)
R Jest zmienną, która w wyniku doświadczenia (losowego) przyjmuje jedną i tylko jedną wartość ze zbioru wszystkich wartości, jakie zmienna ta może przyjąć.
Jest to wielkość, która na skutek przeprowadzonego doświadczenia przyjmuje określoną wartość, znaną dopiero po wykonaniu tego doświadczenia (oznaczenie: X, Y, wartości, jakie przyjmuje: x, y).
Wzajemne przyporządkowanie zmiennych losowych i zdarzeń jest jednoznaczne,
Rodzaje zmiennych losowych:
skokowa (dyskretna) – jest to zmienna, która posiada skończony lub policzalny zbiór wartości, najczęściej są to liczby naturalne (np. liczba oczek wyrzucona za pomocą kostki do gry),
ciągła – jest to zmienna, która może przybierać dowolne wartości liczbowe (rzeczywiste) z pewnego przedziału, nieskończonego i niepoliczalnego (np. stężenie procentowe roztworu).
Zmienna losowa skokowa
Dla zmiennej losowej skokowej X, która przybiera wartości: x1, x2, ..., xn i odpowiadającym i prawdopodobieństwom p1, p2, ..., pn, definiuje się funkcję rozkładu prawdopodobieństwa jako:
Dystrybuantą zmienne losowej X nazywany funkcję F(x) zmiennej rzeczywistej x, która wyznacza prawdopodobieństwo tego, że zmienna losowa X przyjmie w uporządkowanym zbiorze x1 ≤ x2 ... ≤ xi ≤ ...xn-1≤ xn wartość mniejszą od x:
Dla zmiennej losowej skokowej:
Własności dystrybuanty:
przyjmuje wartości z przedziału 0 ≤ F(x) ≤ 1 dla x (–;+);
jest funkcją niemalejącą, tzn. dla x1 < x2 zawsze F(x1) ≤ F(x2);
jest funkcją lewostronnie ciągłą;
oraz .
Przykład 1
Rzucamy trzykrotnie monetą. Zmienną losową oznaczamy liczbę uzyskanych orłów. Przestrzeń zdarzeń elementarnych E = {(RRR), (ROR), (RRO), (ORR), (OOO), (ROO), (OOR), (ORO)}
i Wartość zmiennej losowej xi P(X = xi) Prawdopodobieństwo pi
1 0 P(X = 0) 1/8
2 1 P(X = 1) 3/8
3 2 P(X = 2) 3/8
4 3 P(X = 3) 1/8
Dystrybuanta zmiennej losowej:
P(X = 2) = 3/8 P(X > 2) = P(X > 3) – P(X ≤ 3) = 1 – 7/8 = 1/8
P(X ≤ 2) = 4/8 P(X 2) = P(X > 3) – P(X ≤ 2) = 1 – 4/8 = 6/8
P(X < 2) = 1/8
Parametry zmiennej losowej lub parametry rozkładu zmiennej losowej są to liczby charakteryzujące wartości, jakie może przybierać zmienna losowa.
Wartość oczekiwana (przeciętna) E(x) – jest to wartość, wokół której skupiają się realizacje zmiennej losowej uzyskiwane w wyniku wielokrotnego powtarzania eksperymentu.
Wartość oczekiwana zmiennej losowej skokowej:
– gdy zmienna X przyjmuje n wartości,
– gdy zmienna X przyjmuje przeliczalnie wiele wartości.
Właściwości:
wartość oczekiwana stałej równa się tej stałej:
E(C) = C;
wartość oczekiwana dwóch zmiennych losowych X i Y równa się sumie wartości oczekiwanych tych zmiennych:
E(X+Y) = E(X) + E(Y);
jeżeli dwie zmienne X i Y są niezależne, to wartość oczekiwana iloczynu zmiennych jest równa iloczynowi wartości oczekiwanych tych zmiennych:
E(XY) = E(X)E(Y)
wynika stąd również zależność:
E(CX) = E(C)E(X) = CE(X)
Wariancja zmienne losowej V(X) – miara rozproszenia wartości zmiennej wokół średniej, jest to wartość oczekiwana kwadratu różnicy tej zmiennej i wartości oczekiwanej E(X):
Wariancja zmiennej losowej skokowej:
Własności wariancji:
wariancja stałej równa się zeru:
V(C) = 0;
wariancja iloczynu stałej i zmiennej losowej:
V(CX) = C2V(X);
jeżeli dwie zmienne X i Y są niezależne, to wariancja sumy (różnicy) tych zmiennych jest równa:
V(X Y) = V(X) + V(Y).
Odchylenie standardowe s zmiennej losowej:
Współczynnik zmienności vs:
Współczynnik skośności As:
Medianą Me zmiennej losowej X – nazywamy wartość x, która spełnia układ równań:
Modalną Mo zmiennej losowej X – nazywamy wartość x, której odpowiada największe prawdopodobieństwo realizacji.
Przykład 2
Rzucamy trzykrotnie monetą. Zmienną losową oznaczamy liczbę uzyskanych orłów. Przestrzeń zdarzeń elementarnych E = {(RRR), (ROR), (RRO), (ORR), (OOO), (ROO), (OOR), (ORO)}. Rozkład prawdopodobieństwa:
xi 0 1 2 3
pi 1/8 3/8 3/8 1/8
E(X) = 01/8 + 13/8 + 23/8 + 31/8 = 12/8 = 1,5
V(X) = (0 – 1,5)21/8 + (1 – 1,5)23/8 + (2 – 1,5)23/8 + (3 – 1,5)21/8 = 0,75
Zmienna losowa ciągła
Dla zmiennej losowej ciągłej nie jest możliwe przypisanie wszystkim jej wartościom dodatnich prawdopodobieństw sumujących się do jedności. Można jednak przyporządkować prawdopodobieństwa przedziałom liczbowym:
P(x < X < x+x)
gdzie x jest długością przedziału o początku w x.
Jeżeli x 0 oraz istnieje granica funkcji f(x) w postaci:
to granicę tę nazywamy funkcją gęstości prawdopodobieństwa zmiennej losowej X.
Prawdopodobieństwo tego, że zmienna losowa przyjmuje wartość z przedziału (a, b) – skończonego lub nieskończonego – jest całką funkcji gęstości prawdopodobieństwa w tym przedziale:
Jeżeli zmienna losowa X przybiera wartości z przedziału skończonego (a, b) lub nieskończonego (–, +) to funkcja f(x) musi spełniać warunek:
Prawdopodobieństwo tego, że zmienna losowa ciągła X przyjmie dokładnie wartość a (gdzie a jest dowolną stałą) jest równe zeru:
Nie oznacza to, że zdarzenie x = a jest niemożliwe, jest tylko bardzo mało prawdopodobne, ponadto, prawdopodobieństwo tego, że zmienna losowa X przyjmie wartość inną niż x = a jest równe jedności, co nie świadczy o tym, że jest ono pewne, jest tylko wysoce prawdopodobne.
Dystrybuanta zmiennej losowej ciągłej F(x)=P(X
gdzie f(x) jest funkcją gęstości prawdopodobieństwa zmiennej losowej X, stąd:
Dla zmiennej losowej X przyjmującej wartości z przedziału (a, b):
Ponadto:
Wartość oczekiwana zmiennej losowej ciągłej:
Wariancja zmiennej losowej ciągłej:
Medianą Me zmiennej losowej ciągłej – jest to wartość, dla której spełniona jest równość:
Modalną Mo zmiennej losowej ciągłej – jest to wartość, dla której funkcja gęstości f(x) osiąga maksimum.
Przykład 3
Dana jest funkcja:
Sprawdzić, czy jest to funkcja gęstości zmiennej losowej X.
warunek 1: – funkcja w całym zakresie jest nieujemna.
warunek 2: – aby był spełniony ten warunek musi zachodzić:
ponieważ w przedziale (–;0] i [1;+) funkcja gęstości jest równa zero.
Obydwa warunki są spełnione, więc funkcja f(x) jest funkcją gęstości zmiennej losowej X.
Dla x ≤ 0 dystrybuanta zmiennej losowej X równa się zero, dla dowolnego x z przedziału [0, 1] dystrybuanta wyraża się następująco:
stąd
P(X = 0,5) 0
P(0 < X < 0,1)
F(0,1) – F(0) = 0,01
P(X < 0,5)
F(0,5) = 0,25
P(X > 0,6)
1 – F(0,6) = 1 – 0,36 = = 0,64
Mediana: stąd czyli Me = 0,71
Oznacza to, że zmienna losowa X przyjmuje wartości mniejsze od 0,71 z prawdopodobieństwem 0,5.
Drugi parametr pozycyjny, modalna nie istnieje, gdyż funkcja f(x) nie ma maksimum.
Rozkłady zmiennej losowej skokowej
Rozkład zero-jedynkowy (dwupunktowy)
Zmienna losowa X przyjmuje dwie wartości
x1 = 1 i x2 = 0
z prawdopodobieństwem
P(X=x1=1) = p i P(X=x2=0) = q
Rozkład zero-jedynkowy:
gdzie k=x1=1 lub k=x2=0 oraz 0
Stąd
Dystrybuanta
Wartość oczekiwana
Wariancja
Rozkład dwumianowy
Określa prawdopodobieństwo, tego że realizując n doświadczeń osiągniemy k sukcesów (k ≤ n).
Rozkład dwumianowy:
gdzie jest kombinacją:
oraz k = 0, 1, 2, ..., n i p + q =1
Dystrybuanta:
Wartość oczekiwana:
Wariancja:
Zmienna losowa o rozkładzie dwumianowym opisuje eksperyment noszący nazwę prób Bernoulliego – dlatego rozkład ten nazywany jest rozkładem Bernoulliego.
Eksperyment polega na przeprowadzeniu n (n 2)niezależnych doświadczeń, wynikiem może być tylko jedno z dwóch możliwych stanów: sukces lub porażka.
Uwagi:
prawdopodobieństwo stanu, który został uznany za sukces jest takie samo w kolejnych doświadczeniach (p), prawdopodobieństwo niepowodzenia q łączy się z p zależnością: p + q = 1;
doświadczenia są niezależne, tzn. wynik poprzedniego nie wpływa na wynik następnego.
funkcja rozkładu zależy od dwóch parametrów: liczby doświadczeń n i prawdopodobieństwa sukcesu p;
dla p = q = 1/2 rozkład dwumianowy jest symetryczny, dla p q rozkład jest asymetryczny, jeżeli p < 1/2 – prawostronnie asymetryczny, dla p > 1/2 – lewostronnie asymetryczny.
Przykład 4
Eksperyment polega na pięciokrotnym rzucie monetą. Zmienna losowa przybiera wartości: 0, 1, 2, 3, 4, 5.
Możliwe są dwa wzajemnie wykluczające się wyniki: wypadł orzeł (sukces), wypadła reszka (niepowodzenie), prawdopodobieństwo wyrzucenia orła równe 1/2 nie zmienia się, a wynik danego doświadczenia nie wpływa na wynik następnego – schemat Bernoulliego.
Prawdopodobieństwa poszczególnych wartości i dystrybuanta:
P(X < 2) = P(X = 0) + P(X = 1) = 6/32 lub P(X < 2) = F(2) = 6/32
P(X 3) = 1 – P(X < 3) = 1 – F(3) = 1 – 16/32 = 16/32
Funkcje standardowe programu Excel związane z rozkładem dwumianowym
Rozkład Poissona
Jeżeli prawdopodobieństwo zmiennej losowej X jest opisane rozkładem dwumianowym oraz przyjmuje wartości: k = 0, 1, 2, 3, ..., czyli n , to p przyjmuje takie wartości, że iloczyn np jest wartością stałą równą m (np = m; m > 0).
Rozkład Poissona:
Dystrybuanta:
Wartość oczekiwana:
Wariancja:
Rozkład Poissona jest szczególnym przypadkiem rozkładu dwumianowego, zachodzącym wtedy, gdy prawdopodobieństwo p sukcesu jest małe, a liczba realizacji n na tyle duża, że np = m.
Rozkład Poissona stosuje się jako przybliżenie rozkładu dwumianowego, gdy:
prawdopodobieństwo sukcesu jest mniejsze niż 0,2;
liczba doświadczeń jest równa co najmniej 20.
Przykład 5
Stwierdzono w pewnym wydawnictwie, że ich zecerzy popełniają średnio 1,5 błędu na jednej stronie. Obliczyć prawdopodobieństwa wystąpienia od 0 do 10 błędów na jednej stronie.
Funkcja standardowa programu Excel związana z rozkładem Poissona