następny punkt »


1. TESTY O RÓŻNICY WARTOŚCI ŚREDNICH DWÓCH ROZKŁADÓW NORMALNYCH

Zajmiemy się teraz ważną sytuacją, gdy na podstawie niezależnych prób z dwóch populacji normalnych chcemy stwierdzić, czy średnie w tych populacjach są równe. Rozważymy te zagadnienia najpierw w prostszej sytuacji, gdy znamy wariancje w obu populacjach, a następnie odejdziemy od tego założenia, przyjmując jednak, że nieznane wariancje są sobie równe. W obu sytuacjach nie interesują nas wartości średnich a jedynie wartość ich różnicy. O wzajemnej relacji średnich będziemy wnioskować na podstawie wartości estymatora tej różnicy. Takie problemy testowania są w istocie bardzo bliskie problemowi konstrukcji przedziału ufności dla różnicy średnich omówionej w rozdziale 10.

Niech

     

będą dwiema niezależnymi prostymi próbami losowymi odpowiednio z rozkładów normalnych N(m1,s1) oraz N(m2,s2).

Model 1. (znane odchylenia standardowe s1, s2)

H0: m 1 = m 2,

lub równoważnie

H0: m 1 m 2 = 0.

Statystyka testowa:

Konstrukcja oparta na własnościach zmiennej losowej

Wiemy, że średnie i z prób losowych mają rozkłady normalne, odpowiednio

Jednocześnie i są niezależnymi zmiennymi losowymi, gdyż zostały utworzone na podstawie prób niezależnych . Zatem

i rozkład jest rozkładem normalnym o wartości średniej m 1- m 2 i wariancji

Stąd, po standaryzacji mamy

     

(a) H0: m 1m 2 = 0, H1: m 1m 2 > 0.

Jeśli hipoteza H0 o równości średnich m 1 i m 2 jest prawdziwa, to

     

Przyjmujemy C={z: z ³ z1- a } jako zbiór krytyczny testu hipotezy H0 przeciw H1 na poziomie istotności a, gdzie

     

z1- a jest kwantylem rzędu 1- a rozkładu N(0,1).

Zauważmy, że w tym przypadku odrzucamy hipotezę o równości średnich na rzecz hipotezy m 1 > m 2, gdy różnica jest odpowiednio duża (przekracza pewną wartość progową). Dla wartości progu równej

     

mamy zagwarantowane, że nie częściej niż a × 100% razy odrzucimy H0 w sytuacji, gdy jest ona w istocie prawdziwa (popełnimy błąd I-szego rodzaju).

(b) H0: m 1 m 2 = 0, H1: m 1 m 2 < 0.

Przyjmujemy C={z: z £ za } jako zbiór krytyczny.

(c) H0: m 1m 2 = 0, H1: m 1 m 2 ≠ 0.

Przyjmujemy C={z: | z | ³ z1- a /2} jako obszar krytyczny. Ponieważ

przy tak określonym zbiorze krytycznym prawdopodobieństwo popełnienia błędu pierwszego rodzaju wynosi a.

Przykład

Średnia waga losowo wybranych 20 Europejczyków wyniosła (kg), podczas gdy dla próbki 18 Amerykanów otrzymano (kg). Z poprzednich badań wiadomo, że wariancje wag losowo wybranego Europejczyka i Amerykanina wynoszą, odpowiednio: s 12 = 60 i s 22 = 69. Czy można twierdzić, że średnie wagi w populacji Europejczyków i Amerykanów są różne? Przyjąć a =0,05 oraz rozkład normalny wag.

Z treści przykładu wynika, że chcemy rozważyć następującą hipotezę H0 i H1 :

1. H0: m 1 m 2 = 0,

2. H1: m 1 m 2 ≠ 0.

3.Statystyka testowa:

4. a =0,05, 1- a /2=0,975, z0,975=1,96.

Zbiór krytyczny C={z: | z | ³ 1,96}.

5.Mamy

     

Stąd wartość statystyki testowej

     

6. |- 2| = 2 ³ 1,96, więc odrzucamy H0 na poziomie istotności a =0,05.

Odpowiedź: Na poziomie istotności a =0,05 stwierdzamy, że średnia waga Europejczyka różni się od średniej wagi Amerykanina, przy czym dane sugerują, że średnio Amerykanie ważą więcej niż Europejczycy.

Pytanie kontrolne

Oblicz p-wartość dla obliczonej wartości statystyki i porównaj ją z wartością a =0,05 i a =0,01.

Zobacz odpowiedź

Model 2. (nieznane odchylenia standardowe s 1, s 2)

Założenie dodatkowe: s 1 = s 2 = s, s - nieznane (tylko przy tym dodatkowym założeniu jesteśmy w stanie podać dokładny rozkład statystyki testowej)

H0: m 1 = m 2, lub równoważnie H0: m 1m 2 = 0.

Statystyka testowa:

Jeśli hipoteza H0 jest prawdziwa, to

     

     

Niech

Są to nieobciążone estymatory s 2.

W wykładzie 10 skonstruowaliśmy estymator wariancji s 2 oparty na próbach połączonych. Miał on postać

     

Zastępując we wzorze na Z odchylenie standardowe s estymatorem

otrzymujemy statystykę

     

Dla trzech przypadków możliwych hipotez alternatywnych (a), (b), (c) z modelu 1 mamy analogiczne obszary krytyczne, przy czym kwantyle rozkładu N(0,1) zastępujemy kwantylami rozkładu

     

Przykład

Klasyczne tranzystory domieszkowane złotem (występujące w układach scalonych) mają tzw. czas magazynowania ładunku rzędu 7 ns. Producent ma nadzieję, że pewna zmiana technologii zmniejszyła czas magazynowania. Producent chciałby przetestować hipotezę H0: m 1=m 2 przeciw H1: m 1>m 2, gdzie m 1 oznacza średni czas magazynowania przy starej technologii a m 2 przy nowej technologii. Z poprzednich badań wiadomo, że obie technologie dają w przybliżeniu normalne rozkłady czasu magazynowania, oraz że odchylenia standardowe obu rozkładów są takie same. Producent pobrał dwie niezależne 50 elementowe próbki tranzystorów, produkowanych starą i nową technologią.

Średnie czasy magazynowania dla obu próbek wyniosły

     

Statystyka testowa:

     

Wartość statystyki testowej:

     

H0: m 1 = m 2,

H1: m 1 > m 2.

Stąd zbiór krytyczny

(dla n1+n2=98 kwantyle rozkładu Studenta t98 są bliskie kwantylom standardowego rozkładu normalnego)

oraz p-wartość testu wynosi

Zatem, można przyjąć, że nowa technologia zmniejszyła średni czas magazynowania ładunku.

Uwaga

Jeśli liczności obu prób są duże (n1, n2 ≥ 30) do testowania hipotezy H0: m 1 = m 2 można użyć statystyki testowej

     

która przy spełnieniu H0 ma w przybliżeniu rozkład normalny, nawet gdy wariancje w obu populacjach są różne. Wartości krytyczne i obszary krytyczne wyznaczamy wtedy w oparciu o rozkład normalny w zależności od rodzaju hipotezy alternatywnej.


 następny punkt »