« poprzedni punkt | następny punkt » |
Definicja
Niech X i Y będą zmiennymi losowymi o łącznej funkcji prawdopodobieństwa (lub gęstości) f(x,y). Kowariancją zmiennych X i Y nazywamy liczbę:
Uwaga
Z definicji Cov(X,Y) oraz E[g(X,Y)], przyjmując g(x,y)=(x - m X)(y - m Y), otrzymujemy wzory:
gdy X, Y są dyskretne,
gdy X, Y są ciągłe.
Notacja: Zamiast Cov(X,Y) często piszemy s XY.
Interpretacja. Kowariancja określa pewną miarę zależności między zmiennymi losowymi:
(a) Jeśli dużym wartościom zmiennej X przewyższającym mX towarzyszą zwykle duże wartości zmiennej Y przewyższające mY, a wartościom X mniejszym od mX towarzyszą zwykle wartości Y mniejsze od mY, to
(b) Jeśli wartościom zmiennej X większym od mX towarzyszą zwykle wartości Y mniejsze od mY , a wartościom X mniejszym od mX towarzyszą zwykle wartości Y większe od mY, to Cov (X,Y) < 0.
(c) Zauważmy, że dla X = Y Cov (X,Y) = Var (X) ³ 0.
Stwierdzenie
Cov(X,Y) = E(XY) - m X m Y.
Dowód
Cov(X,Y) = E[(X - m X ) (Y - m Y)] = E(XY - Xm Y - Ym X + m X m Y ) =
= E(XY) - E(Xm Y ) - E(Ym X ) + m X m Y = E(XY) - m X m Y .
Twierdzenie
Jeśli zmienne losowe X i Y są niezależne, to Cov(X,Y) = 0.
Dowód
Dla niezależnych zmiennych losowych E(XY) = E(X) E(Y). Stąd oraz wzoru na kowariancję mamy:
Cov(X,Y) = E(XY) - m X m Y = E(X) E(Y) - m X m Y = 0.
Uwaga
Twierdzenie odwrotne nie jest na ogół prawdziwe. Na przykład niech (X,Y) będą dyskretnymi zmiennymi losowymi o funkcji prawdopodobieństwa łącznego
Zauważmy, że znajomość wartości X determinuje wartość zmiennej Y, zatem X i Y są zależne. Jednocześnie EX= EY = 0 i EXY = (1/4) (2´ 2 + 2´ (- 2) + (- 4)´ 1 + 4´ (- 1)) = 0. Zatem Cov(X,Y) = 0.
Twierdzenie
Dla dowolnych stałych a, b
Var(aX + bY) = a2 Var(X) + b2 Var(Y) + 2abCov(X,Y).
Dowód
E{ [(aX + bY) - (am X + bm Y )]2 } = E{ [a(X - m X) + b(Y - m Y )]2 } =
= E{ [a(X - m X)]2 } + E{ [2ab(X - m X) (Y - m Y )]} + E{ [b(Y - m Y )]2 } =
= a2 Var(X) + 2abCov(X,Y) + b2 Var(Y).
Wniosek
Jeśli zmienne losowe X i Y są niezależne, to
Var(aX + bY) = a2 Var(X) + b2 Var(Y).
Przykład
Niech X1, ... , X5 będą liczbami oczek w pięciu niezależnych rzutach kostką do gry. Wtedy
Var( (X1 + X2 ) / 2 ) = (1/2) Var(X1), a Var( (X1 + X2 + ... + X5) / 5 ) = (1/5) Var(X1).
Zatem wariancja średniej wylosowanej liczby oczek maleje odwrotnie proporcjonalnie do liczby rzutów, a odchylenie standardowe średniej odwrotnie proporcjonalnie do pierwiastka z liczby rzutów. Podobnie zachowuje się wariancja średniej wyników uzyskanych w niezależnych eksperymentach.
« poprzedni punkt | następny punkt » |