następny punkt » |
Zajmiemy się teraz drugim obok estymacji podstawowym zagadnieniem statystyki, jakim jest testowanie hipotez.
Hipoteza statystyczna jest to przypuszczenie dotyczące nieznanej własności rozkładu prawdopodobieństwa badanej cechy populacji.
Przykłady
H: m > 6000.
H: p1 > p2.
H: m > 200.
H: X ~ P(l ), l > 0.
H: X ~ N(m,s ), - ¥ < m < ¥, 0 < s < ¥.
Zauważmy, że hipotezy (a)-(c) są jakościowo różne od hipotez (d) i (e), mianowicie trzy pierwsze hipotezy są stwierdzeniami dotyczącymi nieznanego parametru rozkładu cechy populacji, natomiast w przypadku (d) i (e) chcielibyśmy orzekać, że cecha ma pewien określony rozkład (rozkład normalny w przypadku (e) i Poissona w przypadku (d)).
W zadaniach testowania hipotez wyróżnia się dwie hipotezy. Są to:
Hipoteza zerowa to hipoteza, której prawdziwość poddajemy w wątpliwość i która jest testowana celem ewentualnego odrzucenia, oznaczana przez H0.
Hipoteza alternatywna to hipoteza, która będzie przyjęta, jeśli odrzucimy hipotezę zerową, oznaczana przez H1.
Hipotezę zerową i alternatywną formułuje sie w ten sposób, by się wzajemnie wykluczały.
Niech np. pÎ (0, 1) oznacza prawdopodobieństwo sukcesu w doświadczeniu Bernoulli'ego. Przyjmijmy, że hipoteza H0, którą poddajemy w wątpliwość, orzeka, że p=1/2 (H0: p=1/2), tzn. orzeka, że prawdopodobieństwo sukcesu jest równe prawdopodobieństwu porażki. Możliwe postaci hipotezy alternatywnej to na przykład
H1: p > 1/2
lub
H1: p ¹ 1/2.
Nie może być natomiast hipotezą alternatywną hipoteza H1: p > 1/3, gdyż w tej sytuacji hipoteza zerowa i alternatywna nie wykluczają się.
Rola hipotez H0 i H1 nie jest symetryczna.
Hipoteza alternatywna to ta, którą zaakceptujemy, jeśli próba dostarczy nam dostatecznych dowodów jej prawdziwości, ta o której sądzimy, że jest prawdziwa i potwierdzenia jej prawdziwości szukamy w próbie. Hipoteza zerowa to ta, co do której prawdziwości nie jesteśmy przekonani, którą poddajemy w wątpliwość. W sytuacji, gdy próba nie pozwala nam zaakceptować hipotezy alternatywnej, wiemy, że hipotezy zerowej nie możemy jednak odrzucić.
Sytuacja testowania hipotez przypomina postępowanie sędziego w procesie sądowym. Zadaniem sędziego jest rozpatrzenie problemu winy oskarżonego, gdyż prokurator zgromadził przeciwko niemu dowody, na podstawie których został on oskarżony. Dlatego hipoteza zerową jest w tym przypadku hipoteza o niewinności oskarżonego, hipotezą alternatywną hipoteza o jego winie, a dowody odgrywają tę samą rolę co próba przy testowaniu hipotezy statystycznej tzn. na podstawie nich sędzia orzeka lub nie o winie oskarżonego.
Przykład
Załóżmy, że skuteczność pewnej terapii medycznej wynosi p1´100%. Zaproponowano nową terapię, której nieznana skuteczność p2´100% nie jest gorsza, tzn. wiemy, że p2 ³ p1. Tak jest na przykład wtedy, gdy nowa terapia składa się ze starej terapii i nowego elementu terapeutycznego. Nowa terapia będzie szeroko stosowana, jeśli będziemy mieli po badaniach wstępnych dostatecznie silne przekonanie, że p2 > p1. Należy przeprowadzić testowanie hipotez:
H0: p1 = p2, H1: p1 > p2.
Przykład
Nowa technologia produkcji może zmniejszyć dobowy poziom emisji zanieczyszczeń do atmosfery. Chcielibyśmy wiedzieć, czy zmniejsza ona poziom zanieczyszczeń? Wówczas:
H0: Nowa technologia nie zmniejsza dobowego poziomu emisji zanieczyszczeń atmosfery, tzn. nie jest lepsza od starej technologii.
H1: Nowa technologia zmniejsza dobowy poziom emisji zanieczyszczeń atmosfery, tzn. jest lepsza.
Zadanie testowania powyższych hipotez polega na podjęciu poniższych decyzji, na podstawie obserwacji próby dobowych poziomów emisji zanieczyszczeń.
Możliwe decyzje:
1. Nie ma dostatecznych dowodów aby odrzucić H0, tzn. przyjąć H1. Na podstawie obserwacji nie możemy stwierdzić, że nowa technologia zmniejsza poziom zanieczyszczeń.
2. Obserwacje dostarczają dostatecznych dowodów, aby przyjąć H1, czyli odrzucić H0, tzn. stwierdzamy, iż można uznać, że nowa technologia zmniejsza poziom zanieczyszczeń.
Zbudujmy teraz model matematyczny ostatniego przykładu.
Model matematyczny:
Przyjmijmy, że
(a) m 0 oznacza znany średni poziom dobowy emisji przy starej technologii;
(b) m oznacza nieznany średni poziom dobowy emisji przy nowej technologii.
(c) Załóżmy, że wiemy, iż m £ m 0. Chcielibyśmy stwierdzić, że nowa technologia zmniejsza poziom emisji. Zatem:
H0: m = m 0, H1: m < m 0.
(d) W ciągu n losowo wybranych dni obserwujemy dobowe poziomy emisji przy nowej technologii: X1, X2, ..., Xn;
(e) zmienne losowe X1, X2, ..., Xn są niezależne o jednakowym rozkładzie N(m,s), gdzie s jest znane.
Odpowiednią decyzję: "przyjąć H1" lub "nie można odrzucić H0" rozsądnie jest oprzeć na podstawie realizacji średniej z próby losowej, tzn. średniej
z próbki. Jak wiemy bowiem z prawa wielkich liczb, średnia
powinna dobrze przybliżać nieznaną średnią m.
Dokładniej, z założenia (e) wynika, że rozkładem jest rozkład normalny
skoncentrowany wokół m. Zatem wartości istotnie mniejsze od m
0 sugerują, że H1: m
< m
0 jest prawdziwa, ponieważ
(1) jeśli H0: m
= m
0, jest prawdziwa, to wartości skupiają się wokół m
0, a statystyka
(2) Jeśli H1: m
< m
0, jest prawdziwa, tzn. nieznane m
=m
1 < m
0, , to wartości skupiają się wokół m
1. Wówczas Z jest sumą zmiennej o rozkładzie N(0, 1) oraz stałej ujemnej:
Z jest w tym przypadku sumą zmiennej losowej o rozkładzie normalnym oraz dużej z reguły liczby ujemnej; jest bardzo prawdopodobne, że przy spełnieniu H1 Z będzie istotnie mniejsza od 0.
(1) i (2) sugerują sposób testowania: niech c będzie odpowiednio dobraną stałą, a wartością
obliczoną dla konkretnej próbki, wówczas
(i) jeśli
to przyjmujemy H1,
(ii) jeśli
to orzekamy, że nie ma podstaw do odrzucenia H0.
Statystykę Z nazywamy statystyką testową, gdyż na jej podstawie orzekamy czy hipoteza H1 jest prawdziwa.
Wybór c: Niech a będzie małą liczbą z przedziału (0,1), np. a =0,05, 0,01 lub 0,1. Liczba a ma znaczenie największego dopuszczanego przez użytkownika prawdopodobieństwa błędnego przyjęcia prawdziwości hipotezy H1.
Niech c = za = - z1- a . Wówczas jeśli H0: m = m 0 jest prawdziwa, to
prawdopodobieństwo zajścia zdarzenia A, gdy H0 jest prawdziwa)
Stąd a jest prawdopodobieństwem błędnej decyzji polegającej na przyjęciu H1 w przypadku, gdy hipoteza H0 jest prawdziwa. Taką błędną decyzję nazywamy błędem I rodzaju. Liczba a jest zatem prawdopodobieństwem błędu I rodzaju i nazywana jest poziomem istotności testu.
Zbiór C = {z: z £ za } nazywamy zbiorem krytycznym, bo jest to zbiór wartości statystyki testowej Z, dla których odrzucamy H0 na korzyść H1.
Zauważmy, że skonstruowany test daje nam zabezpieczenie, że nie częściej niż a ´ 100% razy przyjmiemy H1, gdy de facto prawdziwa jest hipoteza H0, natomiast sposób konstrukcji nie daje nam podobnego zabezpieczenia dla prawdopodobieństwa przyjęcia H0, gdy prawdziwa jest hipoteza H1. Dlatego nie mówimy o prawdziwości hipotezy H0 gdy nie została przyjęta hipoteza H1, a jedynie o jej nieodrzuceniu. Błąd nieodrzucenia hipotezy H0, gdy jest ona fałszywa (prawdziwa jest hipoteza H1) nazywamy błędem drugiego rodzaju. Prawdopodobieństwo tego błędu dla każdego konkretnego testu można wyliczyć w sposób dokładny lub przybliżony.
Wynik testowania można syntetycznie opisać tabelką
Podjęta decyzja |
Nieodrzucenie H0 |
Odrzucenie H0 (Akceptacja H1) |
H0prawdziwa |
Decyzja prawidłowa |
Błąd I rodzaju |
H1prawdziwa |
Błąd II rodzaju |
Decyzja prawidłowa |
następny punkt » |