« poprzedni punkt | następny punkt » |
Rozważmy teraz sytuację, gdy mamy do czynienia z parami obserwacji (X1,Y1), (X2,Y2), ... , (Xn,Yn), które są od siebie niezależne, ale zmienne w parze są z reguły zależne. Z taką sytuacją mamy bardzo często do czynienia, gdy dokonujemy dwukrotnego pomiaru cechy tego samego obiektu przed i po dokonaniu na nim pewnego działania, na przykład podaniu leku lub poddaniu go pewnej terapii. Zauważmy, że w tym przypadku średnie i
nie są niezależne, zatem nie możemy stosować rozpatrzonych poprzednio testów dla porównania średnich. Jednakże wiemy, że jeśli obserwacje (X1,Y1), (X2,Y2), ... , (Xn,Yn) są prostą próbą losową z rozkładu dwuwymiarowego, to Di = Xi -
Yi, i=1,...,n tworzą prostą próbę losową. Załóżmy dodatkowo, że pary (Xi,Yi) mają dwuwymiarowy rozkład normalny. Wówczas Di mają jednakowe rozkłady normalne o nieznanej wartości średniej m
D, i=1,...,n.
Hipoteza zerowa:
H0: m D = 0.
Możliwe hipotezy alternatywne:
Statystyka testowa:
Jeśli hipoteza H0 jest prawdziwa, to T ~ tn- 1.
Zatem, obszary krytyczne dla powyższych hipotez pozostają takie same jak przy testowaniu hipotez o wartości średniej jednej populacji normalnej przy nieznanym odchyleniu standardowym. Podkreślmy, że n oznacza w tym przypadku liczbę par.
Przykład
Zmierzono ciśnienie skurczowe wśród losowo wybranej grupy chorych na nadciśnienie przed i po podaniu takiego samego leku każdemu z pacjentów. Otrzymano następujące wyniki:
Pacjent |
1 |
2 |
3 |
4 |
5 |
6 |
Przed |
210 |
180 |
250 |
260 |
190 |
240 |
Po |
180 |
150 |
230 |
250 |
200 |
230 |
Załóżmy, że różnica pomiędzy ciśnieniem przed i po podaniu leku ma rozkład normalny. Czy można twierdzić, na poziomie istotności 0,01, że lek powoduje zmniejszenie wartości średniej ciśnienia skurczowego w populacji ludzi chorych na nadciśnienie?
1.
2.
3. Statystyka testowa:
4. di : 30, 30, 20, 10, −10, 10, , sD = 10,25, n=6
5. a = 0,01, 1- a = 0,99, n- 1 = 6-
6. 3,589 >3,365, więc odrzucamy hipotezę zerową, przyjmując poziom istotności 0,01.
Odpowiedź. Na poziomie istotności 0,01 można twierdzić, że lek obniżył wartość średnią ciśnienia skurczowego w populacji chorych.
Jeśli nie jesteśmy pewni, że możemy przyjąć, iż rozkłady par są normalne, możemy dla porównania rozkładów ciśnienia przed i po zastosowaniu leku użyć tak zwanego testu znaków. Konstruuje się go dla testowania hipotezy, że mediana rozkładu pierwszej współrzędnej pary jest równa medianie rozkładu drugiej współrzędnej w sytuacji, gdy rozkłady współrzędnych są ciągłe. Przy tym założeniu mediana rozkładu różnicy Di = Xi - Yi wynosi 0 i p=P(Di ≥ 0) = 1/2. Zatem
H0: p = 1/2 oraz
H1: p > 1/2.
Statystyka testowa S = #{i £ n: Di ≥ 0} ma przy spełnieniu hipotezy H0 rozkład dwumianowy Bin(n, 1/2) z parametrami n i 1/2. Hipotezę H0 odrzucamy dla dużych wartości statystyki S.
Zastosujmy test znaków w rozpatrywanym przykładzie. Wartość S=6. Zatem odpowiadająca p-wartość jest równa
p-wartość 0,062 jest większa od p-wartości testu rozpatrywanego powyżej. Jest to cena za pozbycie się często restrykcyjnego założenia o normalności badanych cech.
Pytanie kontrolne
Zbadano czasy wykonania (w sek.) czterech losowo wybranych standardowych programów przy zastosowaniu dwu różnych systemów operacyjnych: A i B. Otrzymano wyniki:
Program |
1 |
2 |
3 |
4 |
System A |
5,0 |
4,5 |
7,0 |
7,0 |
System B |
6,5 |
6,5 |
7,5 |
7,0 |
Można przyjąć, że różnica czasów wykonania losowo wybranych programów przy użyciu systemów A i B jest zmienną losową o rozkładzie normalnym.
(a) Czy można twierdzić, że wartości średnie czasów wykonania losowo wybranego programu przy użyciu systemów A i B są różne? Przyjmij poziom istotności 0,05.
(b) Znajdź p-wartość.
Zobacz odpowiedź« poprzedni punkt | następny punkt » |