następny punkt » |
Niech x1, x2, ... , xn oznaczają obserwacje cechy ciągłej X, otrzymywane niezależnie.
Przykłady
Przy nieograniczenie rosnącej liczności próbki n, łamane częstości histogramów unormowanych (takich, że suma pól słupków = 1, gdy wysokość słupka = częstość/h, h = długość przedziału ) zbliżają się do krzywej ciągłej, nazywanej krzywą gęstości lub wykresem gęstości cechy X.
Uzasadnienie
Zatem krzywa gęstości odpowiada kształtowi "idealnego" histogramu unormowanego, który otrzymalibyśmy zwiększając nieograniczenie liczbę obserwacji i liczbę klas. Stąd też pole pod krzywą gęstości wynosi 1.
Rysunki 2.1 i 2.2 przedstawiają histogramy z nałożonymi wykresami gęstości.
Rys. 2.1. Histogram z nałożoną gęstością.
Rys. 2.2. Histogram z nałożoną gęstością.
Niech f(x), xÎ (- ¥, ¥), będzie funkcją, której wykresem jest krzywa gęstości. Wówczas funkcję f nazywamy gęstością rozkładu cechy X (krócej: gęstością cechy X).
Gęstość spełnia warunki:
(a) f(x) ³ 0, xÎ (- ¥, ¥),
(b)
Uzasadnienie
Gęstość odpowiada kształtowi idealnego histogramu unormowanego dla dużych n, dla którego
Zatem te same własności muszą zachodzić dla gęstości rozkładu.
Kształty gęstości opisujemy podobnie jak histogramu: np. gęstość jest prawostronnie skośna: gdy maleje wolniej do zera przy x zbliżającym się do prawego krańca zakresu wartości cechy niż przy x zbliżającym się do jego lewego krańca.
Modą nazywamy argument gęstości f, w którym występuje maksimum lokalne gęstości f.
Gęstość jednomodalna, dwumodalna, lub wielomodalna posiada jedno, dwa, lub wiele maksimów lokalnych, odpowiednio. Poniżej na rys. 2.3 mamy przedstawiony wykres gęstości jednomodalnej, prawostronnie skośnej.
Rys. 2.3. Wykres gęstości jednomodalnej, prawostronnie skośnej.
Niech q będzie ustaloną liczbą z przedziału [0,1]. Wówczas dla próbki o dużej liczności i histogramu unormowanego mamy:
częstość obserwacji ![]() ![]() |
W powyższych sumach j jest największym numerem klasy, której prawy koniec jest nie większy niż q (czyli
Medianą, oznaczaną symbolem q0,5, nazywamy liczbę, taką że pole pod wykresem gęstości na lewo od mediany wynosi 0,5. Zatem
Ostatnia równość jest konsekwencją własności gęstości oraz całki (gdyż sumą obu powyższych całek jest 1).
Definicja
Niech 0 < p <1. Kwantylem rzędu p nazywamy taki punkt qp na osi poziomej (taką liczbę), że pole pod gęstością na lewo od niego wynosi p:
Stwierdzenie
Pole pod wykresem gęstości na prawo od kwantyla rzędu p wynosi 1- p.
Definicja
Uwaga
Powyżej zdefiniowane wielkości są przykładami tzw. wskaźników (inaczej parametrów) gęstości f. Są one odpowiednikami wskaźników sumarycznych (parametrów) próbki. Poniżej, w kolejnych wierszach wymieniamy wskaźniki sumaryczne obliczane dla próbki oraz odpowiadające im wskaźniki gęstości.
Wartość średnia ![]() | Wartość średnia m |
Odchylenie standardowe s | Odchylenie standardowe s |
Pierwszy kwartyl Q1 | Pierwszy kwartyl q0,25 |
Mediana xmed | Mediana q0,5 |
Trzeci kwartyl Q3 | Trzeci kwartyl q0,75 |
Uwaga
Z interpretacji wykresu gęstości jako krzywej przybliżającej łamaną częstości histogramu unormowanego (oraz górne podstawy słupków) wynika, że wskaźniki sumaryczne próbki są bliskie wskaźnikom gęstości, np. średnia jest bliska m, kwartyl Q1 jest bliski q0,25, itd.
następny punkt » |