Náhodná veličina
Author
Albert FloresNáhodná veličina (používají se i různé kombinace slov náhodná, stochastická nebo náhodová a proměnná nebo veličina) je libovolná veličina, kterou je možné opakovaně měřit u různých objektů, v různých místech nebo v různém čase a její hodnoty podrobit zpracování metodami teorie pravděpodobnosti nebo matematické statistiky. Příkladem může být počet ok při vrhu kostkou, teplota naměřená na určitém místě ve stejnou hodinu v různých dnech, roční mzda jednotlivých občanů státu, apod. Náhodnou veličinu lze jednoduše charakterizovat jako veličinu, jejíž hodnoty nelze před provedením pozorování jednoznačně určit, ale závisí na náhodě.
Poněkud přesněji je náhodná veličina funkce, která přiřazuje každému elementárnímu náhodnému jevu nějakou (zpravidla číselnou) hodnotu (například při hodu mincí „hlavě“ nulu a „orlu“ jedničku).
Definice
Formální definice
Formální definice zahrnuje i agregované náhodné proměnné, jako jsou náhodné vektory, náhodné matice, náhodné posloupnosti a náhodné procesy.
Nechť: * (\Omega,\mathcal{F},P) je pravděpodobnostní prostor; to znamená, že ** \Omega je libovolná neprázdná množina (množina elementárních jevů zvaná též výběrový prostor), ** \mathcal{F} je libovolný systém podmnožin \Omega, který tvoří \sigma-algebru, a ** P je pravděpodobnost, čili míra na (\Omega,\mathcal{F}) (tj. zobrazení, které každé podmnožině \Omega, která je zároveň prvkem \mathcal{F}, přiřadí nezáporné reálné číslo), která je normovaná tak, že P(\Omega) = 1 * (E,\mathcal{B}) je měřitelný prostor s borelovskou \sigma-algebrou podmnožin \mathcal{B}; zpravidla se jako E používá množina všech reálných čísel \mathbb{R} nebo nějaká její vhodná podmnožina. +more Náhodnou veličinou pak nazýváme každé zobrazení z prostoru elementárních jevů \Omega do měřitelného prostoru E, tj. X: \Omega \to E, pokud je měřitelné, tj. pokud pro každou množinu B \in \mathcal{B} platí, že \lbrace \omega; \omega \in \Omega, X(\omega) \in B \rbrace \in \mathcal{F}.
Jednoduchá náhodná veličina
Pro hodnoty jednoduché náhodné veličiny lze používat reálná čísla. Pak lze předchozí definici upravit tak, že X je náhodná veličina právě tehdy, když pro každé reálné číslo x platí \lbrace \omega; \omega \in \Omega, X(\omega) (nerovnost může být i neostrá nebo obrácená).
V praxi se příliš neohlížíme na to, aby množina náhodných jevů byla \sigma-algebrou a do definice náhodné veličiny nezahrnujeme pravděpodobnostní míru. Pak může být definice následující: Je-li Ω výběrový prostor přiřazený k výsledkům určitého pokusu, pak náhodná veličina, kterou označíme X, je funkce, která prvkům ω výběrového prostoru Ω přiřazuje reálná čísla x, kde x = X (ω). +moreNáhodné veličiny se označují velkými písmeny latinské abecedy (např. X, Y) a jejich hodnoty malými písmeny (např. x, y).
Náhodné veličiny diskrétního typu
Náhodná veličina je diskrétního typu, pokud množina E je konečná nebo spočetná. Hodnoty náhodné proměnné lze pak psát x1, x2, ….
Pokud je množina E konečná, je možné říct, že Náhodná veličina X je diskrétní, jestliže prvky výběrového prostoru Ω zobrazí na osu reálných čísel jako izolované body, označení x1, x2, …., xk, přičemž každý z těchto bodů má nenulovou pravděpodobnost.
Je-li výběrový prostor konečný, lze použít náhodnou veličinu, která přiřazuje jednotlivým elementárním jevům přirozená čísla, pak lze hodnoty xk označovat pouze symbolem k.
Pro pochopení této problematiky je potřeba znát pravděpodobnostní zákony rozdělení a základní charakteristiky diskrétních náhodných veličin. Rovněž s tímto tématem úzce souvisí důležitá rozdělení diskrétních náhodných veličin (binomické, hypergeometrické, geometrické a Poissonovo).
Mezi pravděpodobnostní zákony diskrétního rozdělení patří pravděpodobnostní funkce, která nese označení P (X = xk), kde xk jsou její hodnoty v číslech. Platí, že ve výběrovém prostoru mají prvky součet svých pravděpodobností roven jedné, potom součet všech hodnot pravděpodobnostní funkce je také roven jedné, tj. +more ∑P (X= xk)= 1.
Dalším pravděpodobnostním zákonem rozdělení náhodné veličiny X je její distribuční funkce, která se značí F (x). Ta je rovna pravděpodobnosti, s jakou náhodná veličina X nabude hodnot z intervalu (- ∞, x), tj. +more F (x)= P (X ≤ x ).
Známe-li hodnoty pravděpodobnostní funkce, pak distribuční funkci diskrétní náhodné veličiny lze získat součtem hodnot pravděpodobnostní funkce P (X= x) v bodech xk, které leží v intervalu (- ∞, x), tj. F (x)= ∑P (X= xk).
Střední hodnota, výběrový průměr, rozptyl, směrodatná odchylka
Střední hodnota
Jedna z nejdůležitějších charakteristik sloužící pro popis diskrétní náhodné veličiny je střední hodnota označená E (X), která je definovaná následujícím vzorcem: :E(X)=\sum_{x_k}x_k*P(X=x_k) Výpočet se provádí tak, že se vynásobí hodnoty diskrétní náhodné veličiny jimi příslušnými hodnotami pravděpodobnostní funkce, a poté se tyto součiny sečtou. Rozlišujeme geometrickou a statistickou interpretaci střední hodnoty. +more Geometricky se střední hodnota znázorňuje jako bod na ose reálných čísel, na níž jsou hodnoty náhodné veličiny. Podle statistické interpretace představuje střední hodnota číslo, kolem něhož kolísají výběrové průměry vypočtené ze sérií pozorovaných hodnot náhodné veličiny.
Výběrový průměr
Výběrový průměr, který nese označení \bar{x}, se počítá dle vzorce: :\bar{x}=\sum_{i=1}^n \frac{x_i}{n}, kde xi jsou hodnoty náhodné veličiny X
a n je počet pokusů.
Pokud opakujeme více sérií pokusu, docházíme ke zjištění, že výběrové průměry kolísají kolem střední hodnoty.
Rozptyl (variance, disperze)
Rozptyl se značí D (X) a vyjadřuje velikost odchylek hodnot diskrétní náhodné veličiny X od její střední hodnoty, přičemž bere v úvahu, jak je pravděpodobnost v těchto bodech rozdělena. Rozptyl se vypočítá následovně: :D(X)=\sum_{x_k}{x_k}^2P(X=x_k)- [E(X)]^2. +more Samotnou hodnotu rozptylu určíme tak, že vypočteme součiny kvadrátů hodnot diskrétní náhodné veličiny s jimi příslušnými hodnotami pravděpodobnostní funkce a potom součiny sečteme. Od získaného součtu odečteme kvadrát střední hodnoty.
Směrodatná odchylka
Jelikož rozptyl má rozměr kvadrátu, je směrodatná odchylka, značená σ (X) vhodnějším vyjádřením charakteristiky dané náhodné veličiny, protože se vypočítá jako odmocnina z rozptylu D (X). :\sigma(X)=\sqrt{ D(X)}. +more Směrodatná odchylka vyjadřuje, o kolik je hodnota náhodné veličiny vzdálena od střední hodnoty.
Vybraná diskrétní rozdělení
Alternativní rozložení
Toto rozložení náhodných veličin lze specifikovat jako rozložení náhodných veličin X, u kterých je známá pravděpodobnost úspěchu v jednom pokusu. Toto rozdělení tedy skýtá možné dva výsledky pokusu (úspěch a neúspěch). +more Pokud jde o úspěch nabývá náhodná veličina hodnoty 1. Pokud se jedná o nepříznivý výsledek nabývá náhodná veličina hodnoty 0. :P(A)=P(X=1)=p .
:P(A)=P(X=0)=1-p
Binomické rozdělení
Toto rozdělení udává rozdělení náhodných veličin jako úspěchů v posloupnosti n opakovaných nezávislých pokusech. Pravděpodobnost výskytu jevu je zde stále stejná. +moreToto rozdělení tedy označujeme jako Bi (n,p), což naznačuje n náhodných pokusů při p pravděpodobnosti úspěchu v každém pokusu. :P[X=x] = {n \choose x}p^x(1-p)^{n-x}, kde x = 0, 1 Zde se vychází z Bernoulliova pokusu, který spočívá v tom, že v daném náhodném pokusu mohou nastat pouze dva stavy: A, A s pravděpodobností p, 1−p. To lze modelovat tzv. binární náhodnou proměnnou Y, pro kterou platí: P(Y = 1) = p a P(Y = 0) = 1−p. Platí: :E(Y)=1. p+0. (1-p)=p :D(Y)=E(Y-p)^2=p. (1-p)^2+(1-p)p^2=(1-p). p Náhodná proměnná X vznikne jako součet n nezávislých binárních proměnných Yi s hodnotami 0 nebo 1, které mají všechny stejné rozdělení určené parametrem p:.
Z tohoto vyplývají i určité charakteristiky tohoto rozdělení. :\operatorname{E}(X)=np
:\operatorname{D}(X) = np(1-p)
Hypergeometrické rozdělení
Toto rozdělení Hg (N,A,n) předpokládá, že v souboru N prvků je A prvků označeno; při náhodném pokusu náhodně vybereme n prvků (bez vracení). Náhodnou veličinou je počet označených prvků z n vybraných. +more Zápis pak vypadá takto: :\operatorname{P}(X=x) = \begin{cases} {{{A \choose x} {{N-A} \choose {n-x}}}\over {N \choose n}} & \text{pro } x \in \langle \text{max} (0,A-N+n),. , \text{min} (A,n) \rangle \\ 0 & \text{jinak. } \end{cases} Vlastnosti tohoto rozdělení tedy lze vyjádřit tímto způsobem: :\operatorname{E}(X) = \frac{n \cdot A}{N}.
:\operatorname{D}(X) = n \frac{A}{N} \left(1 - \frac{A}{N} \right) \left(\frac{N-n}{N-1} \right)
Poissonovo rozdělení
Poissonovo rozdělení udává svou náhodnou veličinou počet výskytů, jež nastanou v nějakém určitém časovém intervalu. Parametr lambda vyjadřuje střední hodnotu počtu výskytů v daném intervalu. +more Toto rozdělení se používá hlavně tam, kde je počet výskytů vzácný, neobvyklý. :P(X=x) = \frac{\lambda^x}{x. }\mathrm{e}^{-\lambda} v daném jednotkovém úseku, kde x = 0,1,2,. ; \lambda>0 je parametr. Vlastnosti rozdělení vypadají takto: :E(X) = \lambda .
:D(X) = \lambda
Náhodné veličiny spojitého typu
Náhodné veličiny spojitého typu jsou charakterizovány následovně:Náhodná veličina X je spojitá, jestliže její hodnoty, přiřazené prvkům výběrového prostoru Ω, tvoří interval na ose reálných čísel, přičemž každý bod toho intervalu má nulovou pravděpodobnost.Hodnota pravděpodobnostní funkce je tedy ve všech bodech nulová, proto musíme použít jiný pravděpodobnostní zákon, pomocí kterého budeme popisovat spojitou náhodnou veličinu, a tou je hustota pravděpodobnosti, označovaná f (x), která vypovídá o tom, jak jsou jednotlivé hodnoty spojité náhodné veličiny X „nahuštěny“ na ose reálných čísel v okolí bodu x.
Další funkcí, které se pro popis spojité náhodné veličiny používá, je funkce distribuční značená F (x), která je rovna pravděpodobnosti P (X≤x ). Charakterizovat ji lze jako funkci, která při postupu po ose reálných čísel „sčítá“ pravděpodobnosti. +more Pomocí hustoty pravděpodobnosti vyjádříme spojitou náhodnou veličinu X integrálem :F(X)=\int_{-\infin}^{x}f(t)dt.
Hustotu pravděpodobnosti v tomto integrálu lze podle pravidel integrálního počtu určit jeho derivací. Z toho vychází, že hustota pravděpodobnosti je rovna derivaci distribuční funkce tedy :f(x)=F'(x). +more V bodě x, kde derivace F´(x) neexistuje, se hustotě pravděpodobnosti přiřadí f(x) libovolná hodnota.
Hustota pravděpodobnosti splňuje podmínku :\int_{-\infin}^{\infin}f(x)dx=1 Integrál představuje geometricky plochu s jednotkovým obsahem, zdola ohraničenou osou reálných čísel a shora grafem hustoty pravděpodobností.
Pravděpodobnost, že spojitá náhodná veličina nabude hodnoty z intervalu s hraničními body x1 a x2 , kde x12, lze vypočítat buď pomocí její hustoty pravděpodobnosti nebo pomocí její distribuční funkce pomocí vzorců :P(x_1 K popisu spojité náhodné veličiny používáme číselné charakteristiky, obdobné náhodným veličinám diskrétního typu. Nejdůležitější charakteristikou náhodné veličiny je střední hodnota, označená E(X), která je definována integrálem :E(X)=\int_{-\infin}^{\infin}xf(x)dx.
Střední hodnota spojité náhodné veličiny má stejný význam jako u diskrétní náhodné veličiny.
Další charakteristikou spojité náhodné veličiny je rozptyl, označovaný D(X), který lze vypočítat takto :D(X)=\int_{-\infin}^{\infin}x^2f(x)dx-[E(X)]^2.
K popisu hodnot rozptýlení spojité náhodné veličiny X se používá častěji směrodatná odchylka, označená σ(X), neboť má stejný rozměr jako náhodná veličina X, kdežto rozptyl má rozměr kvadrátu této veličiny. Směrodatná odchylka je definována takto:
\sigma(X)=\sqrt{D(X)}.
Mezi další charakteristiky, které udávají, jak jsou náhodné veličiny X rozděleny na ose reálných čísel v určitém pravděpodobnostním poměru jsou kvantily. Definovat je lze takto: 100% kvantilem spojité náhodné veličiny X je reálné číslo, označené xp, kdy pro p platí F(xp) = p. +more Význam kvantilu spočívá v tom, že reálnou osu, na níž jsou hodnoty náhodné veličiny X rozloženy, rozdělí na dva intervaly.
K nejdůležitějším kvantilům patří medián, což je 50% kvantil. Medián se používá tehdy, když náhodná veličina nemá definovanou střední hodnotu.
Vybraná spojitá rozdělení
Rovnoměrné rozdělení
Spojitá náhodná veličina X má rovnoměrné rozdělení, jestliže její hustota pravděpodobnosti f (x) a distribuční funkce F (x) jsou zadány předpisy: :\operatorname{f}(x) = \begin{cases} {1\over {b-a}} & \text{pro } x \in \langle \text{a}, b \rangle, \\ 0 & \text{jinak. } \end{cases}, F(x)=\left\{\begin{matrix} 0, & \mbox{pro }x \mbox{b}. +more\end{matrix}\right.
Rovnoměrným rozdělením se řídí takové náhodné veličiny, pro něž pravděpodobnost padnutí do jistého podintervalu zadaného intervalu 〈a,b〉 je úměrná délce tohoto podintervalu a nezávisí na jeho umístění v intervalu 〈a,b〉.Rovnoměrné rozdělení popisuje například chyby při zaokrouhlování čísel, doby čekání na uskutečnění jevu, který se může vyskytnout v časových intervalech pevně stanovené délky, apod.
Střední hodnota a rozptyl rovnoměrného rozdělení jsou: :E(X)=\frac{a+b}{2},\ D(X)=\frac{(b-a)^2}{12}. Hustota pravděpodobnosti a distribuční funkce náhodné veličiny s rovnoměrným rozdělením: +moresvg|žádné|náhled|300x300px'>Hustota pravděpodobnosti Distribucni funkce.
Normální rozdělení
Spojitá náhodná veličina X má normální rozdělení s parametry µ a σ, což se označuje N (µ,σ2), jestliže jsou její hustota pravděpodobnosti f (x) a distribuční funkce F (x) pro x ∈ (-∞,∞) dány předpisy: :f(x)= \frac{1}{\sigma\sqrt{2 \pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}}, F(x)=\frac{1}{\sigma\sqrt{2 \pi}}\int_{-\infin}^{x} e^{-\frac{(t - \mu)^2}{2\sigma^2}\mathrm{d}t}.
Střední hodnota a rozptyl normálního rozdělení jsou: :E(X)=\mu, D(X)=\sigma^2. Křivka znázorňující hustotu pravděpodobnosti normálního rozdělení se nazývá Gaussova křivka. +more Charakteristickými rysy této křivky je to, že je symetrická kolem svislé přímky procházející bodem μ, v němž má funkce f (x) globální maximum, a ve vzdálenostech 3 σ vlevo a vpravo od bodu μ se téměř dotýká osy x.
Graf distribuční funkce F (x) normálního rozdělení a Gaussova křivka: Distribuční funkce +moresvg|žádné|náhled|300x300px'>Gaussova křivka.
Normální rozdělení je nejdůležitějším spojitým rozdělením, protože jej mají mnohé náhodné veličiny, například chyby měření, rozměry výrobků při hromadné výrobě, mnohé jevy ve fyzice, v biologii a medicíně a podobně. Obecně lze říci, že je použitelné všude tam, kde hodnoty náhodné veličiny jsou ovlivněny působením velkého počtu nepatrných vzájemně nezávislých nebo slabě závislých náhodných vlivů. +more Jeho význam spočívá také v tom, že se jím dají za určitých podmínek aproximovat i jiná rozdělení, jak diskrétních, tak i spojitých náhodných veličin.
Při výpočtech úloh se spojitými náhodnými veličinami, které mají normální rozdělení, se tato rozdělení liší svými parametry µ a σ. Pro usnadnění výpočtů je vhodné tyto náhodné veličiny normovat, což se provede tak, že od hodnot náhodné veličiny se odečte její střední hodnota µ a rozdíl se vydělí směrodatnou odchylkou σ. +more Vznikne tak normovaná náhodnou veličinu, označená U, kde :U=\frac{X-\mu}{\sigma} Jestliže náhodná veličina X má normální rozdělení N (µ,σ2), pak jejím normováním vznikne náhodná veličinu U mající normované normální rozdělení, které se označí 'N(0,1), takže má náhodná veličina U střední hodnotu rovnu nule a rozptyl roven jedné.
Distribuční funkce' normované náhodné veličiny U, která je označena FN(u), je pak vyjádřena integrálem: :F_N(u)=\frac{1}{\sqrt{2\pi}}\int_{-\infin}^{u} e^\frac{t^2}{2}\, \mathrm{d}t. Často řešenou úlohou je určení pravděpodobnosti, že náhodná veličina X s normálním rozdělením N(µ,σ2) nabude některé hodnoty z intervalu, jehož krajní body jsou x1 a x2. +more Tuto pravděpodobnost lze vypočíst pomocí vzorce: :P(x_1 .
Protože náhodná veličina X je spojitá, nezáleží tato pravděpodobnost na tom, zda jsou krajní body intervalu do výpočtu zahrnuty nebo ne.
K důležitým vlastnostem náhodné veličiny, mající normální rozdělení, patří pravidlo tří sigma, podle něhož je 99,73 % jejích hodnot v intervalu (μ-3σ,μ+3σ). V tomto intervalu jsou tak prakticky všechny její hodnoty. +more Pravidlo tří sigma lze odvodit s použitím vzorce takto:.
P(\mu-3\sigma\le X \le \mu+3\sigma)=F_N(3)-F_N(-3)=2F_N(3)-1=0,9973.
Exponenciální rozdělení
Spojitá náhodná veličina X má exponenciální rozdělení s parametry A a δ, což se značí E(A,δ), kde δ > 0, jestliže její hustota pravděpodobnosti a distribuční funkce jsou dány předpisy: :f(x)=\left\{\begin{matrix} \frac {1}{\delta}e^\frac{x-A}{\delta}, & \mbox{pro }x>A, \\ 0, & \mbox{pro }\mbox{ jiná x},\end{matrix}\right. F(x)=\left\{\begin{matrix} 1-e^\frac{x-A}{\delta}, & \mbox{pro }x>A, \\ 0, & \mbox{pro }\mbox{ jiná x}. +more\end{matrix}\right.
Graf hustoty pravděpodobnosti a distribuční funkce: Hustota pravděpodobnosti +moresvg|žádné|náhled|400x400px'>Distribuční funkce.
Střední hodnota a rozptyl exponenciálního rozdělení jsou: :E(X)=A+\delta
:D(X)=\delta ^2 Význam parametru A je v tom, že před touto hodnotou se hodnoty náhodné veličiny s exponenciálním rozdělením nemohou vyskytnout.
Exponenciální rozdělení se používá především v teorii hromadné obsluhy a teorii spolehlivosti. Náhodnou veličinou X bývá obvykle doba, během níž nastane sledovaný jev, například doby mezi poruchami přístroje nebo doby mezi příchody zákazníků do opravny. +more V některých případech, jako je například čekání na poruchu přístroje, se náhodná veličina X nazývá „dobou života“ tohoto přístroje.
Exponenciální rozdělení se někdy nazývá rozdělení bez paměti, což lze vyjádřit následovně: Pravděpodobnost, že zařízení, které pracovalo bez poruchy po dobu a, bude pracovat bez poruchy ještě další dobu x, je rovna pravděpodobnosti, že zařízení, které dosud nebylo v provozu, bude pracovat bez poruchy aspoň x hodin, tedy jakoby „zapomnělo“ již odpracovanou dobu.
Pro A = 0 lze vyjádřit tuto vlastnost vyjádřit následovně: :P(X >a+x|X>a)= P(X>x) Exponenciální rozdělení je z těchto důvodů vhodné k popisu rozdělení doby života těch zařízení, u nichž dochází k poruše ze zcela náhodných vnějších příčin, nikoliv například vlivem stárnutí materiálu.
Logaritmicko-normální rozdělení
Hustoty log-normálního rozdělení Logaritmicko-normální rozdělení (stručně lognormální rozdělení) spojité náhodné veličiny se používá mimo jiné při popisu velikosti škody při živelních událostech a různých haváriích a jako model pro rozdělení velikosti platů v některých organizacích.
Spojitá náhodná veličina X má lognormální rozdělení s parametry µ a σ, což se značí LN(µ,σ2), jestliže její hustota pravděpodobnosti f(x) a distribuční funkce F(x) jsou pro x> 0 dány předpisy: :f(x)=\frac{1}{\sigma x\sqrt{2\pi}}e^{-\frac{{(lnx-\mu)}^2}{2\sigma^2}}, F(X)=F_N \left (\frac{lnx-\mu}{\sigma} \right). Střední hodnota a rozptyl lognormálního rozdělení jsou: :E(X)=e ^{\mu+\frac{\sigma^2}{2}}, D(X)=e^{2\mu+\sigma^2}(e^{\sigma^2}-1). +more Jsou-li známy hodnoty E(X) a D(X) lognormálního rozdělení, pak lze parametry µ a σ tohoto rozdělení určit pomocí těchto vzorců: :\sigma^2= \mbox{ ln } \left [ 1 + \frac{D(X)}{\left [E(X)\right ]^2} \right ]; \mu=\mbox{ ln }E(X)-\frac{ \sigma^2 }{ 2 }.
Využití náhodných veličin v marketingu
V prvé řadě nutno podotknout, že využití statistiky jako celku je velmi významné obzvláště při marketingovém výzkumu. Pokud firma pracuje v rámci organizace se svým vlastním marketingovým informačním systémem, je umění práce s informacemi do něj vstupujícími i vystupujícími, zcela klíčové. +more Výstupy tohoto systému je nejlépe popisovat statisticky. Jedním z nejdůležitějších prvků MIS je právě marketingový výzkum, který pracuje se sběrem, analýzou a vyhodnocováním dat, které popisují marketingovou situaci.
Výzkumy jsou většinou založené na bádání po náhodných veličinách a jejich rozdělení. Důležité je v tomto směru samozřejmě zobecňovat výsledky na bázi pravděpodobností, které vypovídají o minulých trendech ale i předvídání budoucích.
Odkazy
Reference
Související články
Teorie pravděpodobnosti * Náhodný jev * Matematická statistika * Rozdělení pravděpodobnosti (též rozložení pravděpodobnosti) * Hustota rozdělení pravděpodobnosti * Pravděpodobnostní funkce * Distribuční funkce
Externí odkazy
Kategorie:Teorie pravděpodobnosti Kategorie:Matematická statistika Kategorie:Veličiny