następny punkt »


1. ESTYMATORY PUNKTOWE

Przykład

W czasie II wojny światowej siły sprzymierzone starały się uzyskać informacje na temat liczby czołgów, którymi dysponowały wojska niemieckie. Poza metodami wywiadowczymi używano następującego prostego podejścia statystycznego, które wykorzystywało fakt, że każdy czołg posiadał numer seryjny. Na podstawie numerów seryjnych zdobytych lub zniszczonych czołgów starano się oszacować liczbę N wyprodukowanych czołgów (przy przyjęciu, że liczba N odpowiada numerowi ostatniego wyprodukowanego dotychczas czołgu). Prostym oszacowaniem liczby czołgów N jest na przykład podwojona średnia numerów wszystkich zdobytych lub zniszczonych czołgów. Oszacowanie to miało tę wadę, że niekoniecznie dawało wartość większą od liczby kmax będącej maksymalnym numerem zdobytego czołgu. Inne rozpatrywane oszacowanie miało postać

     

gdzie n było liczbą zdobytych czołgów. Przy użyciu podobnych rozumowań uzyskano oszacowania liczby N dokładniejsze niż te, którymi dysponował wywiad. Statystyk powiedziałby, że N jest parametrem populacji wszystkich wyprodukowanych czołgów, który chcemy oszacować, jest natomiast estymatorem (oszacowaniem) uzyskanym na podstawie dostępnej próby x1,...,xn numerów zdobytych czołgów. O próbce x1,...,xn z reguły zakładamy, że jest realizacją prostej próby losowej X1,...,Xn. Wtedy możemy sformułować pojęcie estymatora.

Definicja podana poniżej bazuje na pojęciu parametru rozkładu prawdopodobieństwa. Przypomnijmy, że parametrem rozkładu nazywamy dowolną wielkość, którą możemy jednoznacznie wyznaczyć na podstawie tego rozkładu. Parametrami rozkładu są na przykład jego mediana i wariancja.

Definicja

Niech X1,X2, ..., Xn będzie prostą próbą losową z rozkładu, którego parametr q jest nieznany. Statystykę h(X1,X2,...,Xn), dla ustalonej funkcji h, nazywamy estymatorem (punktowym) parametru q i oznaczamy

     

Oczywiście, funkcję h wybieramy tak, żeby wartości h(x1,x2,...,xn) dla konkretnych prób x1,x2,...,xn były rozsądnymi oszacowaniami parametru q. Prawo wielkich liczb daje przesłanki do stwierdzenia, że i S2 są rozsądnymi estymatorami odpowiednio średniej i wariancji.

Powiększmy naszą skromną wiedzę na temat estymatorów parametrów o estymator współczynnika korelacji r. Niech (X1,Y1), (X2,Y2),..., (Xn,Yn) będzie prostą próbą losową, w której każdy element ma taki sam rozkład jak rozkład pary (X,Y). Załóżmy, że współczynnik korelacji pary (X,Y) wynosi r. Niech

Na mocy prawa wielkich liczb dla dużych liczności prób SXY powinno być bliskie EXY - EX× EY = Cov(X,Y). Zatem

     

powinien być rozsądnym estymatorem współczynnika korelacji

     

Z reguły za definicję próbkowego współczynnika korelacji, choć nie ma to dużego znaczenia, przyjmuje się drugie z wyrażeń w (*).

Definicja

Estymator parametru q jest nieobciążony, jeśli dla każdej wartości q

     

Przykłady

(a) Średnia z prostej próby losowej jest nieobciążonym estymatorem wartości średniej m,

     

W szczególności, nieobciążonym estymatorem proporcji p elementów o ustalonej własności jest frakcja elementów próby o tej własności.

(b) Wariancja z prostej próby losowej jest nieobciążonym estymatorem wariancji s 2 rozkładu cechy populacji.

     

W powyższych przykładach szacujemy nieznaną wartość parametru za pomocą jednej liczby zależącej od próby, którą dysponujemy. Nie wiemy na ile estymator punktowy jest wiarygodny tj. jak bardzo prawdopodobne są jego duże odstępstwa od nieznanej wartości parametru. Wady tej nie mają tzw. estymatory przedziałowe zwane inaczej przedziałami ufności dla szacowanego parametru.


 następny punkt »