« poprzedni punkt  następny punkt »


2. TESTY O RÓŻNICY WARTOŚCI ŚREDNICH DLA PAR OBSERWACJI

Rozważmy teraz sytuację, gdy mamy do czynienia z parami obserwacji (X1,Y1), (X2,Y2), ... , (Xn,Yn), które są od siebie niezależne, ale zmienne w parze są z reguły zależne. Z taką sytuacją mamy bardzo często do czynienia, gdy dokonujemy dwukrotnego pomiaru cechy tego samego obiektu przed i po dokonaniu na nim pewnego działania, na przykład podaniu leku lub poddaniu go pewnej terapii. Zauważmy, że w tym przypadku średnie i nie są niezależne, zatem nie możemy stosować rozpatrzonych poprzednio testów dla porównania średnich. Jednakże wiemy, że jeśli obserwacje (X1,Y1), (X2,Y2), ... , (Xn,Yn) są prostą próbą losową z rozkładu dwuwymiarowego, to Di = Xi - Yi, i=1,...,n tworzą prostą próbę losową. Załóżmy dodatkowo, że pary (Xi,Yi) mają dwuwymiarowy rozkład normalny. Wówczas Di mają jednakowe rozkłady normalne o nieznanej wartości średniej m D, i=1,...,n.

Hipoteza zerowa:

      H0: m D = 0.

Możliwe hipotezy alternatywne:

  1. H0: m D > 0,
  2. H0: m D < 0,
  3. H0: m D ≠ 0.

Statystyka testowa:

     

Jeśli hipoteza H0 jest prawdziwa, to T ~ tn- 1.

Zatem, obszary krytyczne dla powyższych hipotez pozostają takie same jak przy testowaniu hipotez o wartości średniej jednej populacji normalnej przy nieznanym odchyleniu standardowym. Podkreślmy, że n oznacza w tym przypadku liczbę par.

Przykład

Zmierzono ciśnienie skurczowe wśród losowo wybranej grupy chorych na nadciśnienie przed i po podaniu takiego samego leku każdemu z pacjentów. Otrzymano następujące wyniki:

Pacjent

     1

     2

     3

     4

     5

     6

Przed

     210

     180

     250

     260

     190

     240

Po

     180

     150

     230

     250

     200

     230

Załóżmy, że różnica pomiędzy ciśnieniem przed i po podaniu leku ma rozkład normalny. Czy można twierdzić, na poziomie istotności 0,01, że lek powoduje zmniejszenie wartości średniej ciśnienia skurczowego w populacji ludzi chorych na nadciśnienie?

1.

2.

3. Statystyka testowa:

     

4. di : 30, 30, 20, 10, −10, 10, , sD = 10,25, n=6

5. a = 0,01, 1- a = 0,99, n- 1 = 6-

6. 3,589 >3,365, więc odrzucamy hipotezę zerową, przyjmując poziom istotności 0,01.

Odpowiedź. Na poziomie istotności 0,01 można twierdzić, że lek obniżył wartość średnią ciśnienia skurczowego w populacji chorych.

Jeśli nie jesteśmy pewni, że możemy przyjąć, iż rozkłady par są normalne, możemy dla porównania rozkładów ciśnienia przed i po zastosowaniu leku użyć tak zwanego testu znaków. Konstruuje się go dla testowania hipotezy, że mediana rozkładu pierwszej współrzędnej pary jest równa medianie rozkładu drugiej współrzędnej w sytuacji, gdy rozkłady współrzędnych są ciągłe. Przy tym założeniu mediana rozkładu różnicy Di = Xi - Yi wynosi 0 i p=P(Di ≥ 0) = 1/2. Zatem

H0: p = 1/2 oraz

H1: p > 1/2.

Statystyka testowa S = #{i £ n: Di ≥ 0} ma przy spełnieniu hipotezy H0 rozkład dwumianowy Bin(n, 1/2) z parametrami n i 1/2. Hipotezę H0 odrzucamy dla dużych wartości statystyki S.

Zastosujmy test znaków w rozpatrywanym przykładzie. Wartość S=6. Zatem odpowiadająca p-wartość jest równa

     

p-wartość 0,062 jest większa od p-wartości testu rozpatrywanego powyżej. Jest to cena za pozbycie się często restrykcyjnego założenia o normalności badanych cech.

Pytanie kontrolne

Zbadano czasy wykonania (w sek.) czterech losowo wybranych standardowych programów przy zastosowaniu dwu różnych systemów operacyjnych: A i B. Otrzymano wyniki:

Program

     1

     2

     3

     4

System A

     5,0

     4,5

     7,0

     7,0

System B

     6,5

     6,5

     7,5

     7,0

Można przyjąć, że różnica czasów wykonania losowo wybranych programów przy użyciu systemów A i B jest zmienną losową o rozkładzie normalnym.

(a) Czy można twierdzić, że wartości średnie czasów wykonania losowo wybranego programu przy użyciu systemów A i B są różne? Przyjmij poziom istotności 0,05.

(b) Znajdź p-wartość.

Zobacz odpowiedź


« poprzedni punkt  następny punkt »