« poprzedni punkt  następny punkt »


3. WSPÓŁCZYNNIK KORELACJI ZMIENNYCH LOSOWYCH

Definicja

Współczynnikiem korelacji między zmiennymi losowymi X i Y, oznaczanym symbolem r (X,Y), nazywamy liczbę:

     

Komentarz. Współczynnik korelacji jest standaryzowaną (niezależną od jednostek) miarą zależności. Zauważmy, że

     Cov (10× X, 10× Y) = Cov (X,Y) × 100,

natomiast

     r (10× X, 10× Y) = r (X,Y).

Bezpośrednio z definicji r (X,Y) = r (Y,X). Często piszemy r zamiast r (X,Y).

Zadanie

Zmienna losowa (X,Y) ma rozkład ciągły o gęstości

  1. Wyznacz stałą C.
  2. Oblicz kowariancję pomiędzy zmiennymi X, Y.
  3. Czy zmienne losowe X, Y są niezależne?
  1. Stąd C = 3.

     

Cov(X,Y) = 0,3 - (3/8)(3/4) = 3/160.

(c) Cov(X,Y) ¹ 0, więc zmienne nie są niezależne, tzn. są zależne.

Powyższy wniosek można było otrzymać bez obliczania kowariancji. Mianowicie, łatwo zauważyć, że fX(x)>0 i fY(y)>0 dla xÎ (0,1) i yÎ (0,1). Jednocześnie f(3/4, 1/2)=0. Zatem f(3/4, 1/2) ¹ fX(3/4) fY(1/2) i zmienne X i Y są zależne.

Przykład (kontynuacja)

Niech zmienne (X,Y) mają następujący rozkład łączny.

      y

   x


0


1


2


fX(x)

   0

0,5

0,05

0,01

0,56

   1

0,2

0,1

0,06

0,36

   2

0,02

0,03

0,03

0,08

  fY(y)

0,72

0,18

0,1

0,03

Obliczymy r (X,Y).

Cov(X,Y) = 0,4 - 0,52 ´ 0,38 = 0,2024.

E(X2) = 12 ´ 0,36 + 22 ´ 0,08 = 0,68.

E(Y2) = 12 ´ 0,18 + 22 ´ 0,1 = 0,58.

Var(X) = E(X2) - [E(X)]2 = 0,68 - 0,522 = 0,4096.

Var(Y) = E(Y2) - [E(Y)]2 = 0,58 - 0,382 = 0,4356.

Własności współczynnika korelacji

(i) - 1 £ r £ 1.

(ii) Jeśli a i b są stałymi, oraz jeśli

      Y = a + bX, to

     

(iii) Jeśli |r | = 1, to Y jest liniowym przekształceniem X, tzn.

     Y = a + b X dla pewnych a i b

     oraz b > 0 gdy r = 1 i b < 0 gdy r = - 1.

(iv) Jeśli zmienne losowe X i Y są niezależne, to r = 0.

Interpretacja. Ze względu na własności (ii) i (iii) współczynnik korelacji jest miarą zależności liniowej między zmiennymi losowymi. Nie może jednak służyć do pomiaru siły zależności nieliniowej.

Metodę szacowania współczynnika korelacji na podstawie próby z rozkładu zmiennych (X,Y) omówimy w wykładzie 10.


« poprzedni punkt  następny punkt »