« poprzedni punkt 


5. PRZEDZIAŁY UFNOŚCI DLA PROPORCJI

Sytuacja 6.

Niech X1, X2, ..., Xn będzie prostą próbą losową z rozkładu Bernoulli'ego o nieznanym parametrze p, tzn. każda ze zmiennych Xi przyjmuje niezależnie od innych z prawdopodobieństwem p wartość 1 i z prawdopodobieństwem 1- p wartość 0.

Wówczas m =E(X1), s 2 =p(1- p).

Niech oznacza proporcję jedynek w próbie interpretowaną w zależności od sytuacji jako proporcję sukcesów (np. częstość elementów próby o danej własności) lub proporcję pozytywnych odpowiedzi. Z Centralnego Twierdzenia Granicznego dla dostatecznie dużego n zmienna losowa

     

ma rozkład bliski rozkładowi N(0, 1) (musi zachodzić np ³ 5, n(1- p) ³ 5).

Okazuje się, że jeśli w mianowniku zastąpimy p(1- p) przez wartość próbkową , to rozkład

     

ma również rozkład bliski N(0, 1), o ile

Stąd

     

Równoważnie

     

Zauważmy, że podobnie jak w poprzednich sytuacjach krańce przedziału ufności dla prawdopodobieństwa p są losowe i zależą od próby.

Przykład

W sondażu opinii publicznej otrzymano wynik: 57% spośród 1000 ankietowanych w 1999 roku Polaków poparło wejście Polski do Unii Europejskiej, a pozostałych 43% osób było przeciwnych. Skonstruować 95% przedział ufności dla proporcji p obywateli popierających w roku 1999 wejście Polski do UE.

Mamy:

     

Z tablic: z0,975 = 1,96.

Próba jest bardzo liczna oraz spełnione są warunki

     

Zatem można wykorzystać znaleziony powyżej przybliżony przedział ufności:

Zatem mamy "95% pewności", że proporcja Polaków popierających wejście Polski do UE jest liczbą z przedziału [0,54, 0,60]. W gazecie przeczytalibyśmy, że 57% Polaków jest za przystąpieniem do UE i błąd sondażu wynosi ± 3%.

Pytanie kontrolne

Spośród 400 dorosłych przypadkowo wybranych warszawiaków zapytanych o regularne uprawianie sportu rekreacyjnego 80 osób odpowiedziało twierdząco. Wyznacz 98% przedział ufności dla proporcji p osób uprawiających sport rekreacyjny w populacji dorosłych warszawiaków.

Zobacz odpowiedź


« poprzedni punkt