« poprzedni punkt | następny punkt » |
Definicja
Współczynnikiem korelacji między zmiennymi losowymi X i Y, oznaczanym symbolem r (X,Y), nazywamy liczbę:
Komentarz. Współczynnik korelacji jest standaryzowaną (niezależną od jednostek) miarą zależności. Zauważmy, że
Cov (10× X, 10× Y) = Cov (X,Y) × 100,
natomiast
r (10× X, 10× Y) = r (X,Y).
Bezpośrednio z definicji r (X,Y) = r (Y,X). Często piszemy r zamiast r (X,Y).
Zadanie
Zmienna losowa (X,Y) ma rozkład ciągły o gęstości
Stąd C = 3.
Cov(X,Y) = 0,3 - (3/8)(3/4) = 3/160.
(c) Cov(X,Y) ¹ 0, więc zmienne nie są niezależne, tzn. są zależne.
Powyższy wniosek można było otrzymać bez obliczania kowariancji. Mianowicie, łatwo zauważyć, że fX(x)>0 i fY(y)>0 dla xÎ (0,1) i yÎ (0,1). Jednocześnie f(3/4, 1/2)=0. Zatem f(3/4, 1/2) ¹ fX(3/4) fY(1/2) i zmienne X i Y są zależne.
Przykład (kontynuacja)
Niech zmienne (X,Y) mają następujący rozkład łączny.
y |
|
|
|
|
0 |
0,5 |
0,05 |
0,01 |
0,56 |
1 |
0,2 |
0,1 |
0,06 |
0,36 |
2 |
0,02 |
0,03 |
0,03 |
0,08 |
fY(y) |
0,72 |
0,18 |
0,1 |
0,03 |
Obliczymy r (X,Y).
Cov(X,Y) = 0,4 - 0,52 ´ 0,38 = 0,2024.
E(X2) = 12 ´ 0,36 + 22 ´ 0,08 = 0,68.
E(Y2) = 12 ´ 0,18 + 22 ´ 0,1 = 0,58.
Var(X) = E(X2) - [E(X)]2 = 0,68 - 0,522 = 0,4096.
Var(Y) = E(Y2) - [E(Y)]2 = 0,58 - 0,382 = 0,4356.
Własności współczynnika korelacji
(i) - 1 £ r £ 1.
(ii) Jeśli a i b są stałymi, oraz jeśli
Y = a + bX, to
(iii) Jeśli |r | = 1, to Y jest liniowym przekształceniem X, tzn.
Y = a + b X dla pewnych a i b
oraz b > 0 gdy r = 1 i b < 0 gdy r = - 1.
(iv) Jeśli zmienne losowe X i Y są niezależne, to r = 0.
Interpretacja. Ze względu na własności (ii) i (iii) współczynnik korelacji jest miarą zależności liniowej między zmiennymi losowymi. Nie może jednak służyć do pomiaru siły zależności nieliniowej.
Metodę szacowania współczynnika korelacji na podstawie próby z rozkładu zmiennych (X,Y) omówimy w wykładzie 10.
« poprzedni punkt | następny punkt » |