« poprzedni punkt  następny punkt »


2. WZÓR BAYESA

Twierdzenie (reguła Bayesa, wzór Bayesa)

Jeśli B1, B2,...,Bk tworzą podział przestrzeni S oraz P(Bi) > 0, i = 1, 2, ..., k, to dla dowolnego zdarzenia A o dodatnim prawdopodobieństwie oraz dowolnego zdarzenia Bm spośród zdarzeń B1, B2,...,Bk, 1 £ m £ k, zachodzi wzór:

     

nazywany wzorem Bayesa.

Dowód

Z definicji prawdopodobieństwa warunkowego oraz wzoru na prawdopodobieństwo całkowite otrzymujemy równości:

Z twierdzenia o prawdopodobieństwie iloczynu zdarzeń mamy P(Bm Ç A)= P(A|Bm) P(Bm), co po wstawieniu do licznika wyrażenia po prawej stronie równości (1) daje nam wzór Bayesa.

Interpretacja. Jeśli skutek A nastąpił w wyniku zajścia jednej z przyczyn B1, B2,...,Bk, to prawdopodobieństwo tego, że Bm była przyczyną zajścia A wyraża się wzorem Bayesa. Prawdopodobieństwo P(Bi) nazywamy czasem prawdopodobieństwem a priori, natomiast prawdopodobieństwo P(Bi|A) nazywamy prawdopodobieństwem a posteriori, gdyż podaje ono szansę zajścia Bi po zaobserwowaniu zajścia zdarzenia A.

Przykład

W konferencji naukowej bierze udział 30 % matematyków i 70 % informatyków. Wśród matematyków jest 50 % kobiet, a wśród informatyków zaledwie 10 % stanowią kobiety. Wybrana losowo osoba jest kobietą. Obliczymy prawdopodobieństwo, że jest ona matematykiem.

Określamy zdarzenia:

A = {wybrana losowo osoba jest kobietą},

B1 = {wybrana losowo osoba jest matematykiem},

B2 = {wybrana losowo osoba jest informatykiem}.

W treści zadania podane są prawdopodobieństwa

P(B1) = 0,3,   P(B2) = 0,7,    P(A|B1) = 0,5,    P(A|B2) = 0,1.

Do obliczenia prawdopodobieństwa P(B1|A) zastosujemy wzór Bayesa:

Zauważmy, że prawdopodobieństwo wyboru matematyka: P(B1) = 0,3, a po zaobserwowaniu zdarzenia A (wybrana osoba jest kobietą) prawdopodobieństwo warunkowe P(B1|A) znacznie zwiększyło się, gdyż na konferencji wśród kobiet jest dużo matematyków, zatem prawdopodobieństwo tego, że wybrana osoba jest matematykiem zwiększyło się, jeśli wiemy, że ta osoba jest kobietą.

Pytanie kontrolne

Dla danych z poprzedniego przykładu oblicz prawdopodobieństwo tego, że wybrana losowo osoba jest matematykiem, jeśli wiemy, że jest to mężczyzna.

Zobacz odpowiedź

Przykład

Wiadomo, że 5% produkowanych elementów ma wady. Podczas kontroli jakości 95% elementów dobrych klasyfikowanych jest jako elementy dobre, a 90% elementów wadliwych jako wadliwe.

(a) Jakie jest prawdopodobieństwo, że element jest wadliwy, jeśli został zaklasyfikowany jako wadliwy?

(b) Jakie jest prawdopodobieństwo, że element jest dobry, jeśli został zaklasyfikowany jako dobry?

Niech B1 = {element dobry}, B2 = {element wadliwy},

A = {element zaklasyfikowany jako wadliwy}.

P(B1) = 0,95,  P(B2) = 0,05,   P(A' | B1) = 0,95,  P(A |B1) = 1 - 0,95,  P(A |B2) = 0,9.

Stosując wzór Bayesa otrzymujemy:

Zauważmy, że P(B1 | A¢ ) > P(B1), tzn. prawdopodobieństwo warunkowe zdarzenia, że element jest dobry pod warunkiem, że został zaklasyfikowany jako dobry jest większe od prawdopodobieństwa, że element jest dobry, gdyż prawdopodobieństwo dobrej klasyfikacji elementu dobrego jest duże.

Przykład (KM, str. 91-92)

Test medyczny wykrywa określoną chorobę (wynik dodatni testu) u osoby chorej z prawdopodobieństwem 0,99, natomiast u osoby zdrowej prawdopodobieństwo wyniku dodatniego (błędnej diagnozy) jest 0,02. Wiadomo, że szansa zapadnięcia na tę chorobę wynosi 1/1000. Obliczymy prawdopodobieństwo, że osoba jest rzeczywiście chora, jeśli wynik testu był dodatni.

Wprowadźmy zdarzenia: B1 = {losowo wybrana osoba jest chora},

B2 = {losowo wybrana osoba jest zdrowa}.

A = {u losowo wybranej osoby test da wynik dodatni}

P(B1) = 0,001,   P(B2) = 0,999, P(A| B1) = 0,99,   P(A| B2) = 0,02.

P(B2| A) = 1 - P(B1| A) = 0,953.

Powyższy pozornie paradoksalny rezultat wynika stąd, że choroba jest bardzo rzadka. Natomiast testowi poddana jest losowo wybrana osoba z populacji gdzie średnio na 1000 osób 999 jest zdrowych, więc zajście zdarzenia A nie wpłynęło znacznie na zmianę prawdopodobieństw zdarzeń B1, B2. W przypadku tak rzadkiej choroby konieczny jest test o znacznie mniejszym prawdopodobieństwie błędnej diagnozy u osoby zdrowej.


« poprzedni punkt  następny punkt »