« poprzedni punkt |
Sytuacja 6.
Niech X1, X2, ..., Xn będzie prostą próbą losową z rozkładu Bernoulli'ego o nieznanym parametrze p, tzn. każda ze zmiennych Xi przyjmuje niezależnie od innych z prawdopodobieństwem p wartość 1 i z prawdopodobieństwem 1- p wartość 0.
Wówczas m =E(X1), s 2 =p(1- p).
Niech oznacza proporcję jedynek w próbie interpretowaną w zależności od sytuacji jako proporcję sukcesów (np. częstość elementów próby o danej własności) lub proporcję pozytywnych odpowiedzi. Z Centralnego Twierdzenia Granicznego dla dostatecznie dużego n
zmienna losowa
ma rozkład bliski rozkładowi N(0, 1) (musi zachodzić np ³ 5, n(1- p) ³ 5).
Okazuje się, że jeśli w mianowniku zastąpimy p(1-
p) przez wartość próbkową , to rozkład
ma również rozkład bliski N(0, 1), o ile
Stąd
Równoważnie
Zauważmy, że podobnie jak w poprzednich sytuacjach krańce przedziału ufności dla prawdopodobieństwa p są losowe i zależą od próby.
Przykład
W sondażu opinii publicznej otrzymano wynik: 57% spośród 1000 ankietowanych w 1999 roku Polaków poparło wejście Polski do Unii Europejskiej, a pozostałych 43% osób było przeciwnych. Skonstruować 95% przedział ufności dla proporcji p obywateli popierających w roku 1999 wejście Polski do UE.
Mamy:
Z tablic: z0,975 = 1,96.
Próba jest bardzo liczna oraz spełnione są warunki
Zatem można wykorzystać znaleziony powyżej przybliżony przedział ufności:
Zatem mamy "95% pewności", że proporcja Polaków popierających wejście Polski do UE jest liczbą z przedziału [0,54, 0,60]. W gazecie przeczytalibyśmy, że 57% Polaków jest za przystąpieniem do UE i błąd sondażu wynosi ± 3%.
Pytanie kontrolne
Spośród 400 dorosłych przypadkowo wybranych warszawiaków zapytanych o regularne uprawianie sportu rekreacyjnego 80 osób odpowiedziało twierdząco. Wyznacz 98% przedział ufności dla proporcji p osób uprawiających sport rekreacyjny w populacji dorosłych warszawiaków.
Zobacz odpowiedź« poprzedni punkt |