Bayesova věta
Author
Albert FloresBayesova věta: ilustrace pomocí dvou spojených třídimenzionálních stromových diagramů Bayesova věta (alternativně Bayesova formule, Bayesův vzorec) je věta teorie pravděpodobnosti, která udává, jak podmíněná pravděpodobnost nějakého jevu souvisí s opačnou podmíněnou pravděpodobností. Poprvé na tuto souvislost upozornil anglický duchovní Thomas Bayes (1702-1761) v posmrtně vydaném článku An Essay towards solving a Problem in the Doctrine of Chances (1763). Roku 1774 větu znovu objevil francouzský matematik a fyzik Pierre-Simon Laplace, nicméně postupně upadla v zapomnění a rozšířila se až v 2. polovině 20. století. Frekvenční interpretace pravděpodobnosti se poté nazývá klasická či Laplaceova, právě podle Pierre-Simona Laplace.
Jedno z mnoha použití Bayesovy věty je v oblasti statistické inference (konkrétně Bayesova inference). Věta taktéž položila základy relativně novému směru statistiky - Bayesovská statistika.
Znění věty
Jednoduchá forma Bayesovy věty
Mějme dva náhodné jevy A a B, přičemž P(B) \neq 0. Potom platí:
:P(A\mid B) = \frac{P(B\mid A)\, P(A)}{P(B)}, kde :* P(A\mid B) je podmíněná pravděpodobnost jevu A za předpokladu, že nastal jev B :* P(B\mid A) je podmíněná pravděpodobnost jevu B podmíněná výskytem jevu A :* P(A) a P(B) jsou pravděpodobnosti jevů A a B
Bayesova věta
Mějme náhodné jevy A a B_j, pro j = {1,. ,k}. +more Nechť jsou jevy B_j vzájemně neslučitelné pro každé j a nechť v každém pokusu nastává právě jeden z nich, takže součet jejich pravděpodobností je roven jedné: :{\sum_{i=1}^k P(B_i) = 1 }.
Potom platí: :P(B_j\mid A) = \frac{P(A\mid B_j)\, P(B_j)}{P(A)} \!, kde :* P(A\mid B_j) je podmíněná pravděpodobnost jevu A za předpokladu, že nastal jev B_j :* P(B_j\mid A) je podmíněná pravděpodobnost jevu B_j za předpokladu, že nastal jev A :* P(A) je pravděpodobnost jevu A
Důkaz Bayesovy věty
Pro jednoduchost uvažujme pouze dva náhodné jevy. Důkaz Bayesovy věty vychází z definice podmíněné pravděpodobnosti: :P(A\mid B) = \frac{P(A \cap B)}{P(B)}, \text{ pokud } P(B) \neq 0, kde P(A \cap B) je pravděpodobnost průniku jevů A, B. +more Symetricky: :P(B\mid A) = \frac{P(A \cap B)}{P(A)}, \text{ pokud } P(A) \neq 0. Vyjádřením pravděpodobnosti průniku v obou rovnicích a následným dosazením jedné rovnosti do druhé, získáme výslednou Bayesovu formuli: :P(A\mid B) = \frac{P(B\mid A) P(A)}{P(B)}, \text{ pokud } P(B) \neq 0. \square.
Alternativní forma Bayesovy věty
Při počítání s Bayesovou formulí je výhodné znát následující úpravu, jelikož často neznáme pravděpodobnost náhodných jevů, nýbrž pouze jejich pravděpodobnosti podmíněné.
Tato formule spočívá ve vhodné úpravě jmenovatele: :P(B) = P(B\mid A)\cdot P(A) + P(B\mid \neg A) \cdot P(\neg A), kde využíváme vztahu: :B = (B \cap A)\cup (B \cap\neg A ). Po dosazení do původní věty tedy dostáváme: :P(A\mid B) = \frac{P(B\mid A) P(A)}{P(B\mid A) P(A) + P(B\mid \neg A) P(\neg A)}.
Opět lze jednoduchými úvahami zobecnit pro více jevů. Mějme náhodné jevy A_j, j = {1,. +more,k}. Pravděpodobnost jevu B lze interpretovat jako sumu součinu pravděpodobností P(B\mid A_j) a P(A_j) (Věta o úplné pravděpodobnosti), tj. :P(B) = {\sum_j P(B\mid A_j) P(A_j)}.
Podmíněnou pravděpodobnost jevu P(A_i\mid B) za pomocí výše zmíněných úvah vyjádříme následovně: : P(A_i\mid B) = \frac{P(B\mid A_i) P(A_i)}{\sum\limits_j P(B\mid A_j) P(A_j)}.
Příklady použití
Testování na drogy
Nyní si ukažme příklad použití Bayesova pravidla při testování na drogy. Vyjdeme z předpokladů, že test na prokázání drog má senzitivitu 99 % a specificitu 99 %. +more Test se na první pohled zdá být docela přesný, ale pomocí Bayesovy věty lze ukázat, že netriviální procento testovaných může být nesprávně označeno za uživatele drog. Nechť je v testovaném podniku prevalence 0,5 %, tj. 0,5 % ze zaměstnanců drogy opravdu užívá.
Jaká je pravděpodobnost, že osoba s pozitivním testem drogy opravdu používá?
Označme si uživatele drog jako "A", "N" všechny ostatní. Nechť "+" znamená pozitivní test. Popišme si následující veličiny:
* P(A) pravděpodobnost, že osoba je uživatelem drog (prevalence), tj. 0. +more005 * P(N) pravděpodobnost, že osoba není uživatelem drog; zjistíme pomocí doplňkového jevu, tzn. 1 - P(A) = 0. 995 * P(+\mid A) pravděpodobnost, že test je pozitivní, když je osoba uživatelem drog; jinými slovy sensitivita testu: 0. 99 * P(+\mid N) je pravděpodobnost, že test bude pozitivní, i přesto, že osoba není uživatelem drog; lze interpretovat jako doplněk k specificitě testu: 0. 01 * P(+) je pravděpodobnost, že test bude pozitivní.
Pravděpodobnost P(+) sice zadanou nemáme, ale lze ji vypočítat dle výše zmíněné formule:
P(+) = P(+\mid A)\cdot P(A) + P(+\mid N) \cdot P(N)
Po dosazení dostáváme výsledek 1,49 %:
P(+) = 0.99 \times 0.005 + 0.01 \times 0.995 = 0.0149.
Díky těmto údajům můžeme vypočítat žádanou pravděpodobnost P(A\mid +) pomocí Bayesovy věty:
P(A\mid +) = \frac{P(+\mid A) P(A)}{P(+)} = \frac{0.99 \times 0.005}{0.0149} = 0.3322.
Všimněme si, že i přes vysokou specificitu a senzitivitu je výsledek testu poměrně nepřesný. U zaměstnance podniku s pozitivním testem je jen 33% pravděpodobnost, že je skutečně uživatelem drog.
Specificita a Sensitivita
Senzitivita testu (alt. citlivost testu) nám udává úspěšnost, s níž test zachytí přítomnost sledovaného stavu (nemoci) u daného subjektu. +more V našem příkladu to znamená, že test správně identifikuje skutečné uživatele drog v 99 % případů.
Specificita testu nám vyjadřuje úspěšnost, s níž test určí případy, u nichž zkoumaný stav (nemoc) nenastává. 99% specificita testu znamená, že test s 99% pravděpodobností správně vyloučí osobu, která drogy nepoužívá.
Odkazy
Reference
Související články
Bayesovská statistika * Bayesovské hry
Externí odkazy
Kategorie:Údržba:Články s referencemi v nadpisech Kategorie:Bayesovská statistika Kategorie:Teorie pravděpodobnosti