Statistická nezávislost
Author
Albert FloresVrhneme-li zároveň dvě hrací kostky, lze čísla, která padnou, považovat za nezávislá, protože znalost čísla na jedné kostce nic neříká o tom, co padlo na druhé z nich Nezávislost je základní pojem teorie pravděpodobnosti, matematické statistiky a teorie stochastických procesů. Dva náhodné jevy jsou nezávislé, statisticky nezávislé nebo stochasticky nezávislé, pokud výskyt jednoho nemá vliv na pravděpodobnost výskytu druhého (ekvivalentně řečeno, nemá vliv na šance výskytu druhého jevu). Podobně jsou dvě náhodné veličiny nezávislé, pokud realizace jedné neovlivní rozdělení pravděpodobnosti druhé. Definiční a často využívanou vlastností nezávislých jevů je, že pravděpodobnost jejich společného výskytu se rovná součinu pravděpodobností jejich výskytů. Opakem nezávislosti je statistická závislost, například korelace.
Pokud jde o soubor více než dvou jevů, je třeba rozlišovat slabé a silné pojetí nezávislosti. Jevy se nazývají po dvou nezávislé, pokud jsou jakékoli dva jevy v souboru nezávislé, a nezávislé (nebo kolektivně nezávislé), pokud každý jev je nezávislý na jakékoli kombinaci dalších jevů v souboru. +more Podobná definice platí pro soubory náhodných proměnných. Z (kolektivní) nezávislosti plyne nezávislost po dvou, ale naopak to neplatí.
Obecnějším konceptem je podmíněná nezávislost, která vyjadřuje, že dva náhodné jevy či veličiny A a B jsou nezávislé ve smyslu pravděpodobností podmíněných třetím náhodným jevem či veličinou Z. To neformálně řečeno znamená, že jakmile máme k dispozici informaci obsaženou v Z, není už další informace A užitečná pro přesnější poznání B ani znalost B nepřidá nic pro pochopení A, i kdyby A a B byly vzájemně závislé.
Příklady
Házení hrací kostkou: Jev, že padne 6 při prvním hodu kostkou a jev padnutí 6 při druhém hodu jsou nezávislé. Naproti tomu jev, že padne 6 při prvním hodu kostkou a jev, že součet čísel zaznamenaných v prvním a druhém pokusu je 8, nejsou nezávislé jevy.
Tahání náhodných karet z promíchaného balíčku: Pokud jsou z balíčku karet vytaženy dvě karty s vracením (první vytažená karta se vrátí do balíčku před tažením druhé karty), jsou jevy vytažení červené karty v prvním pokusu a vytažení červené karty ve druhém pokusu nezávislé. Naproti tomu pokud jsou dvě karty vytaženy bez vracení, událost tažení červené karty v prvním pokusu a událost tažení červené karty ve druhém pokusu nejsou nezávislé, protože po vytažení první červené karty balíček už obsahuje o jednu červenou kartu méně.
Definice
Náhodné jevy
Viz též Nezávislé jevy.
Dva náhodné jevy A a B jsou nezávislé (zapsáno A \perp B nebo A \perp\. \. +more\. \perp B) právě tehdy, pokud se pravděpodobnost jejich společného výskytu rovná součinu pravděpodobností jejich výskytů:.
:\mathrm{P}(A \cap B) = \mathrm{P}(A)\mathrm{P}(B)
Proč se nezávislost definuje takto, je jasné po přepsání s použitím podmíněných pravděpodobností:
: \mathrm{P}(A \cap B) = \mathrm{P}(A)\mathrm{P}(B) \iff \mathrm{P}(A) = \frac{\mathrm{P}(A \cap B)}{\mathrm{P}(B)} = \mathrm{P}(A\mid B) .
a podobně
: \mathrm{P}(A \cap B) = \mathrm{P}(A)\mathrm{P}(B) \iff \mathrm{P}(B) = \mathrm{P}(B\mid A) .
To znamená, že výskyt B nemá vliv na pravděpodobnost A a naopak. Ačkoli se odvozené výrazy mohou zdát intuitivnější, nejedná se o upřednostňovanou definici, protože podmíněné pravděpodobnosti nemusejí být definované, pokud \mathrm{P}(A) nebo \mathrm{P}(B) jsou 0. +more Kromě toho upřednostňovaná definice je zjevně symetrická, takže je z ní vidět, že když A je nezávislý na B, tak B je také nezávislý na A.
: \mathrm{P}(A) = \mathrm{P}(A \cap A) = \mathrm{P}(A) \cdot \mathrm{P}(A) \Leftrightarrow \mathrm{P}(A) = 0 \text{ or } \mathrm{P}(A) = 1 .
Zobecnění na více jevů: Konečná množina jevů \{ A_i \} _{i=1}^{n} je po dvou nezávislá, pokud je každá dvojice jevů nezávislá - to znamená, že pro všechny vzájemně odlišné páry indexů m,k
:\mathrm{P}(A_m \cap A_k) = \mathrm{P}(A_m)\mathrm{P}(A_k)
Konečná množina jevů je nezávislá, pokud je každý jev nezávislý na libovolném průniku ostatních jevů - to znamená, že pro každé k \leq n a pro každou k -prvkovou podmnožina jevů \{ B_i \} _{i=1}^{k} z \{ A_i \} _{i=1}^{n} platí
:\mathrm{P}\left(\bigcap_{i=1}^k B_i\right)=\prod_{i=1}^k \mathrm{P}(B_i)
Toto se nazývá pravidlo násobení pravděpodobností pro nezávislé jevy. Všimněte si, že nejde o jedinou podmínku zahrnující pouze součin všech pravděpodobností všech jednotlivých jevů; vzorec musí platit pro všechny podmnožiny dané množiny jevů.
Pro více než dva jevy je nezávislá množina jevů (podle definice) také nezávislá po dvou; ale opak nemusí nutně platit.
Náhodné veličiny
Dvě reálné náhodné veličiny X a Y jsou nezávislé tehdy a právě tehdy, jsou-li prvky jimi generovaného π systému nezávislé; to znamená, že pro každé x a y jsou jevy \{ X \le x\} a \{ Y \le y\} nezávislé (jak je definováno výše). Z toho plyne, že X a Y s distribučními funkcemi F_X(x) a F_Y(y) jsou nezávislé, pokud kombinovaná náhodná proměnná (X,Y) má kumulativní distribuční funkci
:F_{X,Y}(x,y) = F_X(x) F_Y(y) \quad \forall x,y,
z čehož plyne, že pokud existují hustoty pravděpodobnosti f_X(x) a f_Y(y) a společná hustota pravděpodobnosti f_{X,Y}(x,y), tak
: f_{X,Y}(x,y) = f_X(x) f_Y(y) \quad \forall x,y .
Zobecnění na více než dvě náhodné veličiny: Konečná množina n náhodných veličin \{X_1,\ldots,X_n\} je po dvou nezávislá, jestliže je každá dvojice náhodných veličin z této množiny nezávislá.
Konečná množina n náhodných veličin \{X_1,\ldots,X_n\} je nezávislá, jestliže pro jakoukoli posloupnost čísel \{x_1, \ldots, x_n\} jsou jevy \{X_1 \le x_1\}, \ldots, \{X_n \le x_n \} vzájemně nezávislé (jak je definováno výše). To je ekvivalentní následující podmínce o společné distribuční funkci F_{X_1,\ldots,X_n}(x_1,\ldots,x_n): množina \{X_1,\ldots,X_n\} je nezávislý právě tehdy, když
:F_{X_1,\ldots,X_n}(x_1,\ldots,x_n) = F_{X_1}(x_1) \cdot \ldots \cdot F_{X_n}(x_n) \quad \forall x_1,\ldots,x_n
Všimněte si, že zde není nutné vyžadovat, aby rozdělení pravděpodobnosti faktorizovalo pro všechny možné podmnožiny k prvků jako v případě pro n jevů. Je to proto, že např. +more F_{X_1,X_2,X_3}(x_1,x_2,x_3) = F_{X_1}(x_1) \cdot F_{X_2}(x_2) \cdot F_{X_3}(x_3) totiž implikuje F_{X_1,X_3}(x_1,x_3) = F_{X_1}(x_1) \cdot F_{X_3}(x_3) atp.
Náhodné vektory
Dva reálné náhodné vektory \mathbf{X}=(X_1,...,X_m)^T a \mathbf{Y}=(Y_1,...,Y_n)^T jsou nezávislé, pokud
:F_{\mathbf{X,Y}}(\mathbf{x,y}) = F_{\mathbf{X}}(\mathbf{x}) \cdot F_{\mathbf{Y}}(\mathbf{y}) \quad \forall \mathbf{x},\mathbf{y},
kde F_{\mathbf{X}}(\mathbf{x}) a F_{\mathbf{Y}}(\mathbf{y}) jsou distribuční funkce \mathbf{X} a \mathbf{Y} a F_{\mathbf{X,Y}}(\mathbf{x,y}) označuje jejich společnou distribuční funkci. Nezávislost \mathbf{X} a \mathbf{Y} se často označuje \mathbf{X} \perp\. +more\. \. \perp \mathbf{Y} . Rozepsáno po komponentách:.
: F_{X_1,\ldots,X_m,Y_1,\ldots,Y_n}(x_1,\ldots,x_m,y_1,\ldots,y_n) = F_{X_1,\ldots,X_m}(x_1,\ldots,x_m) \cdot F_{Y_1,\ldots,Y_n}(y_1,\ldots,y_n) \quad \forall x_1,\ldots,x_m,y_1,\ldots,y_n .
Stochastické procesy
Definici nezávislosti lze rozšířit z náhodných vektorů na stochastické procesy. Nezávislý stochastický proces je takový, u kterého náhodné veličiny získané jeho vzorkováním v libovolných n časových okamžicích t_1,\ldots,t_n (pro libovolné přirozené n) jsou nezávislé náhodné veličiny.
Formálně zapsáno se stochastický proces \left\{ X_t \right\}_{t\in\mathcal{T}} nazývá nezávislý, právě když pro všechna n\in \mathbb{N} a pro všechny t_1,\ldots,t_n\in\mathcal{T}
:F_{X_{t_1},\ldots,X_{t_n}}(x_1,\ldots,x_n) = F_{X_{t_1}}(x_1) \cdot \ldots \cdot F_{X_{t_n}}(x_n) \quad \forall x_1,\ldots,x_n,
kde F_{X_{t_1},\ldots,X_{t_n}}(x_1,\ldots,x_n) = \mathrm{P}(X(t_1) \leq x_1,\ldots,X(t_n) \leq x_n) . Nezávislost stochastického procesu je jeho vnitřní vlastnost, nikoli vztah mezi dvěma různými stochastickými procesy.
Vzájemná nezávislost dvou stochastických procesů je vztah mezi dvěma stochastickými procesy \left\{ X_t \right\}_{t\in\mathcal{T}} a \left\{ Y_t \right\}_{t\in\mathcal{T}} definovanými na stejném pravděpodobnostním prostoru (\Omega,\mathcal{F},P). Formálně dva stochastické procesy \left\{ X_t \right\}_{t\in\mathcal{T}} a \left\{ Y_t \right\}_{t\in\mathcal{T}} jsou považovány za nezávislé, pokud pro všechna n\in \mathbb{N} a pro všechny t_1,\ldots,t_n\in\mathcal{T} jsou náhodné vektory (X(t_1),\ldots,X(t_n)) a (Y(t_1),\ldots,Y(t_n)) navzájem nezávislé, tj. +more pokud.
:F_{X_{t_1},\ldots,X_{t_n},Y_{t_1},\ldots,Y_{t_n}}(x_1,\ldots,x_n,y_1,\ldots,y_n) = F_{X_{t_1},\ldots,X_{t_n}}(x_1,\ldots,x_n) \cdot F_{Y_{t_1},\ldots,Y_{t_n}}(y_1,\ldots,y_n) \quad \forall x_1,\ldots,x_n
: \mathrm{P}(X = x | Y = y, Z = z) = \mathrm{P}(X = x | Z = z)
Important
Vlastnosti
Nezávislost na sobě samém
Všimněte si, že jev je na sobě nezávislý právě tehdy, když
: \mathrm{P}(X \le x, Y \le y\;|\;Z = z) = \mathrm{P}(X \le x\;|\;Z = z) \cdot \mathrm{P}(Y \le y\;|\;Z = z)
Jev je tedy na sobě nezávislý, právě když k němu skoro jistě dojde nebo skoro jistě nedojde (dojde k jeho doplňku); tato skutečnost je užitečná při dokazování různých vět, které tvrdí, že nějaký jev má buď pravděpodobnost jedna nebo nula, nic mezi (anglicky tzv. zero-one laws).
Střední hodnota a kovariance
Pokud X a Y jsou nezávislé náhodné veličiny, pak operátor střední hodnoty \operatorname{E} má vlastnost
: \operatorname{E}[X Y] = \operatorname{E}[X] \operatorname{E}[Y],
a kovariance \operatorname{cov}[X,Y] je nula, jak vyplývá z
: \operatorname{cov}[X,Y] = \operatorname{E}[X Y] - \operatorname{E}[X] \operatorname{E}[Y] .
Opačné tvrzení neplatí: pokud dvě náhodné proměnné mají kovarianci 0, stále nemusejí být nezávislé.
Podobně pro dva stochastické procesy \left\{ X_t \right\}_{t\in\mathcal{T}} a \left\{ Y_t \right\}_{t\in\mathcal{T}} : Pokud jsou nezávislé, pak jsou nekorelované.
Charakteristická funkce
Dvě náhodné proměnné X a Y jsou nezávislé právě tehdy, pokud charakteristická funkce náhodného vektoru (X,Y) splňuje
: \varphi_{(X,Y)}(t,s) = \varphi_{X}(t)\cdot \varphi_{Y}(s) .
Konkrétně charakteristická funkce jejich součtu je produktem jejich marginálních charakteristických funkcí:
: \varphi_{X+Y}(t) = \varphi_X(t)\cdot\varphi_Y(t),
ačkoli obrácená implikace neplatí.
Testování nezávislosti
Častou úlohou v matematické statistice je testování hypotézy, že naměřené veličiny jsou vzájemně nezávislé. Pro nominální znaky se k tomu účelu používá test nezávislosti nominálních znaků, jeden z rodiny chí kvadrátových testů. +more Pro znaky vyšších typů se obvykle používá testování nulovosti korelačních koeficientů (typicky Spearmanovy či Pearsonovy korelační koeficienty), i když je nutno mít na paměti, že nekorelovanost je nutným, ale nikoli dostatečným předpokladem stochastické nezávislosti, takže se může stát, že veličiny jsou nekorelované, ale přitom vzájemně závislé.
Podmíněná nezávislost
Pro jevy je podmíněná nezávislost definována takto: Jevy A a B jsou podmíněně nezávislé vzhledem k jevu C, když
\mathrm{P}(A \cap B \mid C) = \mathrm{P}(A \mid C) \cdot \mathrm{P}(B \mid C) .
Pro náhodné veličiny je definice podobná. Neformálně řečeno jsou dvě náhodné veličiny X a Y podmíněně nezávislé vzhledem k Z, pokud platí, že jakmile je známa hodnota Z, tak Y už nepřidá žádné další informace o X . +more Například dvě měření X a Y stejné hodnoty Z nejsou nezávislé, ale jsou podmíněně nezávislé vzhledem k Z (pokud chyby v obou měřeních nejsou nějakým způsobem spojeny).
Formální definice podmíněné nezávislosti je založena na myšlence podmíněného rozdělení Pokud X, Y a Z jsou diskrétní náhodné veličiny, pak definujeme X a Y jako podmíněně nezávislé vzhledem k Z, pokud
:\mathrm{P}(X \le x, Y \le y\;|\;Z = z) = \mathrm{P}(X \le x\;|\;Z = z) \cdot \mathrm{P}(Y \le y\;|\;Z = z)
pro všechny x, y a z takové, že \mathrm{P}(Z=z)>0. Dále pokud jsou náhodné proměnné spojité a mají společnou funkci hustoty pravděpodobnosti f_{XYZ}(x,y,z), pak X a Y jsou podmíněně nezávislé vzhledem k Z, pokud
: f_{XY|Z}(x, y | z) = f_{X|Z}(x | z) \cdot f_{Y|Z}(y | z)
pro všechna reálná čísla x, y a z taková, že f_Z(z)>0 .
Je-li diskrétní X a Y jsou podmíněně nezávislé vzhledem k Z, pak
:\mathrm{P}(X = x | Y = y , Z = z) = \mathrm{P}(X = x | Z = z)
pro všechny x, y a z při podmínce \mathrm{P}(Z=z)>0. To znamená, že rozdělení X podmíněné Y a Z je stejné jako rozdělení podmíněné jen samotným Z. +more Podobná rovnice platí pro podmíněné funkce hustoty pravděpodobnosti v spojitém případě.
Nezávislost lze chápat jako zvláštní druh podmíněné nezávislosti, protože na pravděpodobnost lze pohlížet jako na zvláštní případ podmíněné pravděpodobnosti, pokud ji nepodmiňujeme žádným jevem.
Pro statistické testování podmíněné nezávislosti se používají chí-kvadrát testy a testy parciálních korelací.
Příklad podmíněné nezávislosti: Teplota a intenzita osvětlení na nějakém místě bývají korelovány, protože v noci a v zimě je obvykle méně světla a zároveň nižší teplota. Ze znalosti teploty tedy můžeme pomocí regresní analýzy upřesnit odhad intenzity osvětlení a naopak. +more Kdybychom však k pozorování teploty a intenzity osvětlení přidali ještě údaj o přesném čase, tak se může stát, že znalost teploty již (příliš) nevylepší odhad intenzity osvětlení nad rámec odhadu založeného na čase, takže osvětlení a teplota budou (téměř) statisticky nezávislé podmíněno časem.