Bayesova věta

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

Bayesova věta: ilustrace pomocí dvou spojených třídimenzionálních stromových diagramů Bayesova věta (alternativně Bayesova formule, Bayesův vzorec) je věta teorie pravděpodobnosti, která udává, jak podmíněná pravděpodobnost nějakého jevu souvisí s opačnou podmíněnou pravděpodobností. Poprvé na tuto souvislost upozornil anglický duchovní Thomas Bayes (1702-1761) v posmrtně vydaném článku An Essay towards solving a Problem in the Doctrine of Chances (1763). Roku 1774 větu znovu objevil francouzský matematik a fyzik Pierre-Simon Laplace, nicméně postupně upadla v zapomnění a rozšířila se až v 2. polovině 20. století. Frekvenční interpretace pravděpodobnosti se poté nazývá klasická či Laplaceova, právě podle Pierre-Simona Laplace.

Jedno z mnoha použití Bayesovy věty je v oblasti statistické inference (konkrétně Bayesova inference). Věta taktéž položila základy relativně novému směru statistiky - Bayesovská statistika.

...

Znění věty

Jednoduchá forma Bayesovy věty

Mějme dva náhodné jevy A a B, přičemž P(B) \neq 0. Potom platí:

:P(A\mid B) = \frac{P(B\mid A)\, P(A)}{P(B)}, kde :* P(A\mid B) je podmíněná pravděpodobnost jevu A za předpokladu, že nastal jev B :* P(B\mid A) je podmíněná pravděpodobnost jevu B podmíněná výskytem jevu A :* P(A) a P(B) jsou pravděpodobnosti jevů A a B

Bayesova věta

Mějme náhodné jevy A a B_j, pro j = {1,. ,k}. +more Nechť jsou jevy B_j vzájemně neslučitelné pro každé j a nechť v každém pokusu nastává právě jeden z nich, takže součet jejich pravděpodobností je roven jedné: :{\sum_{i=1}^k P(B_i) = 1 }.

Potom platí: :P(B_j\mid A) = \frac{P(A\mid B_j)\, P(B_j)}{P(A)} \!, kde :* P(A\mid B_j) je podmíněná pravděpodobnost jevu A za předpokladu, že nastal jev B_j :* P(B_j\mid A) je podmíněná pravděpodobnost jevu B_j za předpokladu, že nastal jev A :* P(A) je pravděpodobnost jevu A

Důkaz Bayesovy věty

Pro jednoduchost uvažujme pouze dva náhodné jevy. Důkaz Bayesovy věty vychází z definice podmíněné pravděpodobnosti: :P(A\mid B) = \frac{P(A \cap B)}{P(B)}, \text{ pokud } P(B) \neq 0, kde P(A \cap B) je pravděpodobnost průniku jevů A, B. +more Symetricky: :P(B\mid A) = \frac{P(A \cap B)}{P(A)}, \text{ pokud } P(A) \neq 0. Vyjádřením pravděpodobnosti průniku v obou rovnicích a následným dosazením jedné rovnosti do druhé, získáme výslednou Bayesovu formuli: :P(A\mid B) = \frac{P(B\mid A) P(A)}{P(B)}, \text{ pokud } P(B) \neq 0. \square.

Alternativní forma Bayesovy věty

Při počítání s Bayesovou formulí je výhodné znát následující úpravu, jelikož často neznáme pravděpodobnost náhodných jevů, nýbrž pouze jejich pravděpodobnosti podmíněné.

Tato formule spočívá ve vhodné úpravě jmenovatele: :P(B) = P(B\mid A)\cdot P(A) + P(B\mid \neg A) \cdot P(\neg A), kde využíváme vztahu: :B = (B \cap A)\cup (B \cap\neg A ). Po dosazení do původní věty tedy dostáváme: :P(A\mid B) = \frac{P(B\mid A) P(A)}{P(B\mid A) P(A) + P(B\mid \neg A) P(\neg A)}.

Opět lze jednoduchými úvahami zobecnit pro více jevů. Mějme náhodné jevy A_j, j = {1,. +more,k}. Pravděpodobnost jevu B lze interpretovat jako sumu součinu pravděpodobností P(B\mid A_j) a P(A_j) (Věta o úplné pravděpodobnosti), tj. :P(B) = {\sum_j P(B\mid A_j) P(A_j)}.

Podmíněnou pravděpodobnost jevu P(A_i\mid B) za pomocí výše zmíněných úvah vyjádříme následovně: : P(A_i\mid B) = \frac{P(B\mid A_i) P(A_i)}{\sum\limits_j P(B\mid A_j) P(A_j)}.

Příklady použití

Testování na drogy

Nyní si ukažme příklad použití Bayesova pravidla při testování na drogy. Vyjdeme z předpokladů, že test na prokázání drog má senzitivitu 99 % a specificitu 99 %. +more Test se na první pohled zdá být docela přesný, ale pomocí Bayesovy věty lze ukázat, že netriviální procento testovaných může být nesprávně označeno za uživatele drog. Nechť je v testovaném podniku prevalence 0,5 %, tj. 0,5 % ze zaměstnanců drogy opravdu užívá.

Jaká je pravděpodobnost, že osoba s pozitivním testem drogy opravdu používá?

Označme si uživatele drog jako "A", "N" všechny ostatní. Nechť "+" znamená pozitivní test. Popišme si následující veličiny:

* P(A) pravděpodobnost, že osoba je uživatelem drog (prevalence), tj. 0. +more005 * P(N) pravděpodobnost, že osoba není uživatelem drog; zjistíme pomocí doplňkového jevu, tzn. 1 - P(A) = 0. 995 * P(+\mid A) pravděpodobnost, že test je pozitivní, když je osoba uživatelem drog; jinými slovy sensitivita testu: 0. 99 * P(+\mid N) je pravděpodobnost, že test bude pozitivní, i přesto, že osoba není uživatelem drog; lze interpretovat jako doplněk k specificitě testu: 0. 01 * P(+) je pravděpodobnost, že test bude pozitivní.

Pravděpodobnost P(+) sice zadanou nemáme, ale lze ji vypočítat dle výše zmíněné formule:

P(+) = P(+\mid A)\cdot P(A) + P(+\mid N) \cdot P(N)

Po dosazení dostáváme výsledek 1,49 %:

P(+) = 0.99 \times 0.005 + 0.01 \times 0.995 = 0.0149.

Díky těmto údajům můžeme vypočítat žádanou pravděpodobnost P(A\mid +) pomocí Bayesovy věty:

P(A\mid +) = \frac{P(+\mid A) P(A)}{P(+)} = \frac{0.99 \times 0.005}{0.0149} = 0.3322.

Všimněme si, že i přes vysokou specificitu a senzitivitu je výsledek testu poměrně nepřesný. U zaměstnance podniku s pozitivním testem je jen 33% pravděpodobnost, že je skutečně uživatelem drog.

Specificita a Sensitivita

Senzitivita testu (alt. citlivost testu) nám udává úspěšnost, s níž test zachytí přítomnost sledovaného stavu (nemoci) u daného subjektu. +more V našem příkladu to znamená, že test správně identifikuje skutečné uživatele drog v 99 % případů.

Specificita testu nám vyjadřuje úspěšnost, s níž test určí případy, u nichž zkoumaný stav (nemoc) nenastává. 99% specificita testu znamená, že test s 99% pravděpodobností správně vyloučí osobu, která drogy nepoužívá.

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top