Odhad (statistika)
Author
Albert FloresOdhadem se v matematické statistice nazývá určení parametru rozdělení hodnoty určitého znaku v populaci (základním souboru) na základě hodnot zjištěných u určitého vzorku (výběrového souboru). Odhady se dělí na bodové a intervalové. V angličtině se rozlišuje metoda nebo funkce odhadu dané veličiny od jejího výsledku . Například výběrová střední hodnota je často používaný odhad střední hodnoty základního souboru.
Bodový odhad je jedna hodnota, která udává „nejlepší“ (nepravděpodobnější) hodnotu daného parametru. („Jedna hodnota“ nutně nemusí znamenat „jedno číslo“, ale může se jednat o vektor nebo funkci. +more).
Intervalový odhad je interval, do něhož hodnota parametru spočítaná na základě výběru padne s určitou předem stanovenou pravděpodobností (obvykle 95 nebo 99 %).
Výhodou bodového odhadu je, že poskytuje jedinou hodnotu, se kterou je možné dál počítat. Jeho nevýhodou je, že nevíme, jaká je pravděpodobnost toho, že se skutečný výsledek od bodového odhadu bude odchylovat. +more Intervalový odhad, který se používá pro testování statistických hypotéz, tuto nevýhodu nemá. V praxi se intervalový odhad často zapisuje ve tvaru s\pm ch příp. s \pm n %, kde s je aritmetický (příp. geometrický) průměr dolní a horní meze intervalu.
Pokud například házíme poctivou mincí, je číslo 5 nejlepším bodovým odhadem, kolik padne hlav z deseti hodů. Ale pravděpodobnost toho, že hlava padne přesně v polovině případů, je u deseti hodů jen přibližně čtvrtinová. +more Proto by nás malá odchylka od rozdělení počtu hlav a orlů přesně na polovinu neměla vést k tomu, že minci prohlásíme za nepoctivou. Na druhou stranu, pravděpodobnost toho, že z 10 hodů mincí padne 10x nebo 9x táž strana, je přibližně 2 %; proto při takovém výsledku hypotézu, že je mince poctivá, zpravidla zamítneme (pokud jsme předem stanovili hladinu testu 5 %; pokud by předem stanovená hladina byla 1 %, připustili bychom i padnutí 9 hlav nebo orlů).
Teorie odhadu se zabývá vlastnostmi odhadů; to jest definičními vlastnostmi, které lze používat pro porovnávání různých odhadů (různých pravidel pro vytváření odhadů) stejné veličiny ze stejných dat. Takové vlastnosti lze použít pro určení nejlepšího pravidla pro dané okolnosti. +more V robustní statistice však statistická teorie pokračuje v uvažování rovnováhy mezi dobrými vlastnostmi, za dodržení striktně definovaných předpokladů, a méně dobrými vlastnosti, které platí při volnějších podmínkách.
Pozadí
„Bodový odhad“ je metoda vybraná pro určení hodnoty neznámého parametru ze vzorku dat. Tato metoda je (měřitelnou) funkcí definovanou na výběrovém prostoru, a je tedy statistikou (funkcí dat). +more V české terminologii se často přívlastek „bodový“ vypouští a název „odhad“ se používá jak pro metodu tak pro získanou hodnotu; v angličtině se obvykle rozlišuje (metoda) a (hodnota), ale oba termíny se někdy zaměňují.
Parametr, který se má odhadovat, se někdy nazývá . Může být konečněrozměrný (v případě parametrických a semiparametrických modelů) nebo nekonečněrozměrný (u semiparametrických a neparametrických modelů). +more Pokud označíme parametr symbolem \theta, pak odhad se tradičně označuje přidáním stříšky nad symbol: \widehat{\theta}.
Definice neklade prakticky žádná omezení na to, jaké funkce dat lze nazývat „odhady“. Atraktivitu různých odhadů lze posoudit podle jejich vlastností, např. +more nestrannosti, střední kvadratické chyby, konzistence, asymptotického rozdělení, atd. Konstrukce a porovnání odhadů jsou předmětem teorie odhadu. V kontextu teorie rozhodování je odhad typem rozhodovacího pravidla, jehož výkonnost lze vyčíslit pomocí nákladové funkce.
Když slovo „odhad“ se používá bez přívlastku, obvykle se tím míní bodový odhad. Odhad v tomto případě je jediný bod v prostor parametrů. +more Jiným typem odhadu jsou intervalové odhady, jejichž výsledkem je podmnožina prostoru parametrů.
Ve dvou aplikacích se objevuje problém odhadu hustoty: při odhadování hustoty pravděpodobnosti náhodných proměnných a při odhadování spektrální hustoty časových řad. V těchto problémech jsou odhady funkcemi, které považovat za bodové odhady v nekonečněrozměrném prostoru, přičemž existují odpovídající problémy intervalových odhadů.
Definice
Předpokládejme, že má být odhadnut pevný parametr \theta. „Odhad“ je pak funkce, která mapuje prostor elementárních jevů do množiny hodnot odhadů. +more Odhad parametru \theta se obvykle označuje symbolem \widehat{\theta}. Často je pohodlné vyjádřit teorii pomocí algebry náhodných proměnných: pokud se tedy X používá pro označení náhodné veličiny odpovídající pozorovaným datům, odhad (samotný považovaný za náhodnou proměnnou) je symbolizován funkcí této náhodné proměnné, \widehat{\theta}(X). Odhad pro určitou pozorovanou datovou hodnotu x (tj. pro X=x) pak je \widehat{\theta}(x), což je pevná hodnota. Často se používá zkrácený zápis, ve kterém je \widehat{\theta} interpretováno přímo jako náhodná veličina, což však může způsobovat nedorozumění.
Kvantifikované vlastnosti
V teorii odhadu se používají následující definice a atributy:
Chyba
Je-li dán vzorek (výběrový soubor) x , „chyba“ odhadu \widehat{\theta} je definována vzorcem :e(x)=\widehat{\theta}(x) - \theta, kde \theta je parametr, který je odhadován. Chyba e, závisí nejen na odhadu (vzorci nebo postupu odhadu), ale také na vzorku.
Střední kvadratická chyba
Střední kvadratická chyba odhadu \widehat{\theta} je definována jako střední hodnota (pravděpodobností váženého průměru přes všechny vzorky) druhé mocniny chyb; to jest :\operatorname{MSE}(\widehat{\theta}) = \operatorname{E}[(\widehat{\theta}(X) - \theta)^2]. Používá se k popisu toho, jak moc se v průměru soubor odhadů odchyluje od parametru, který byl odhadován. +more Uvažujme následující analogii. Předpokládejme, že parametr je střed terče, odhad je proces házení šipek na terč, a jednotlivé šipky jsou odhady (vzorky). Pak velká střední kvadratická chyba znamená, že průměrná vzdálenost šipek od středu terče je velká, a malá střední kvadratická chyba znamená, že průměrná vzdálenost od středu terče je malá. Přitom šipky mohou ale nemusí být shluklé. Pokud by například všechny šipky zasáhly stejný bod, ale značně míjely střed, bude střední kvadratická chyba stále relativně velká. Pokud je však střední kvadratická chyba relativně malá, pak šipky v terči jsou pravděpodobně více shluklé.
Vzorkovací odchylka
Je-li dán vzorek x , definujeme vzorkovací odchylku odhadu \widehat{\theta} jako :d(x) =\widehat{\theta}(x) - \operatorname{E}( \widehat{\theta}(X) ) =\widehat{\theta}(x) - \operatorname{E}( \widehat{\theta} ), kde \operatorname{E}( \widehat{\theta}(X) ) je střední hodnota odhadu. Vzorkovací odchylka d závisí nejen na odhadu, ale také na vzorku.
Rozptyl
Rozptyl (statistika) odhadu \widehat{\theta} je střední hodnota druhé mocniny vzorkovací odchylky; to jest \operatorname{Var}(\widehat{\theta}) = \operatorname{E}[(\widehat{\theta} - \operatorname{E}[\widehat{\theta}]) ^2]. Používá se k označení toho, jak daleko, v průměru, soubor odhadů jsou z střední hodnota odhadů. +more (Všimněte si rozdílu mezi střední kvadratickou chybou a rozptylem. ) Pokud parametr odpovídá středu terče, a šipky jsou odhady, pak relativně velký rozptyl znamená, že šipky jsou více roztroušené, a naopak, relativně malý rozptyl znamená, že šipky jsou shluklé. I když je rozptyl malý, shluk šipek může být stále daleko od středu terče; pokud je rozptyl velký, shluk šipek může být nevychýlený. A i kdyby všechny šipky značně minuly střed terče, pokud by všechny zasáhly stejný bod, byl by rozptyl nulový.
Vychýlenost
Vychýlenost odhadu \widehat{\theta} se definuje jako B(\widehat{\theta}) = \operatorname{E}(\widehat{\theta}) - \theta. Je to vzdálenost mezi průměrem souboru odhadů, a parametrem, který se odhaduje. +more Vychýlenost odhadu \widehat{\theta} je funkcí skutečné hodnoty \theta, takže pokud řekneme, že vychýlenost odhadu \widehat{\theta} je b, znamená to, že pro každé \theta je vychýlenost odhadu \widehat{\theta} rovna b.
Existují dva druhy odhadů: vychýlené odhady a nevychýlené odhady. Zda je odhad vychýlený nebo není, lze zjistit vztahem mezi \operatorname{E}(\widehat{\theta}) - \theta a 0: * Pokud \operatorname{E}(\widehat{\theta}) - \theta\neq0, \widehat{\theta} je vychýlený. +more * Pokud \operatorname{E}(\widehat{\theta}) - \theta=0, \widehat{\theta} je nevychýlený.
Vychýlenost je také střední hodnotou chyby, protože \operatorname{E}(\widehat{\theta}) - \theta = \operatorname{E}(\widehat{\theta} - \theta ) . Pokud parametr je střed terče a šipky jsou odhady, pak relativně velká absolutní hodnota vychýlenosti znamená, že průměrná pozice šipek je mimo střed terče, a relativně malá absolutní vychýlenost znamená, že průměrný poloha šipek je blízko středu terče. +more Šipky mohou být roztroušené nebo shluklé. Vztah mezi vychýleností a rozptylem je podobný jako vztah mezi přesností a precizností.
Odhad \widehat{\theta} je nestranným odhadem parametru \theta právě tehdy, když B(\widehat{\theta}) = 0. Vychýlenost je vlastností estimátoru, ne odhadu. +more Často se mluví o „vychýleném“ nebo „nevychýleném odhadu“, ale ve skutečnosti to znamená „odhad z vychýleného esimátoru“ nebo „odhad z nestranného esimátoru“. Lidé také často zaměňují „chybu“ jednoho odhadu s „vychýleností“ estimátoru. To, že je chyba jednoho odhadu velká, nemusí znamenat, že je odhad vychýlený. Ve skutečnosti, i když by měly všechny odhady astronomické absolutní hodnoty chyb, pokud by střední hodnota chyby byla nulová, byl by odhad nevychýlený (nestranný). Také to, že odhad je vychýlený, nemusí znamenat, že chyba odhadu, je v určitém konkrétním případě nenulová. Ideální situace je mít nestranný odhad s malým rozptylem, a také se snažit omezit počet vzorků, kde je chyba extrémní (to znamená mít málo odlehlých hodnot). Nestrannost však není nezbytná. Pokud je povolena pouze malá vychýlenost, pak lze často nalézt odhad s nižší střední kvadratickou chybou nebo s menším počtem odlehlých hodnot vzorků.
Alternativou k výše uvedené verzi „nevychýlenosti“, je „mediánová nevychýlenost“, kde medián rozdělení odhadů souhlasí se skutečnou hodnotou; v dlouhodobém horizontu bude tedy polovina odhadů příliš malá a polovina příliš velká. Přestože to platí bezprostředně pouze pro skalární odhady, lze to rozšířit na jakoukoli míru centrální tendence rozdělení: viz mediánově nevychýlené odhady.
V praxi může mít \widehat{\theta} vždy funkcionální vztah s \theta. Například genetický teorie říká, že jeden typ listů, škrobovitě zelený, se objevuje s pravděpodobností p_1=1/4\cdot(\theta + 2), pro 0. +more Pro n listů může být náhodnou proměnnou N_1 udávající počet škrobovitých zelených listů modelovat rozdělením Bin(n,p_1). Pro vyjádření odhadu veličiny lze použít \theta: \widehat{\theta}=4/n\cdot N_1-2. Můžeme ukázat, že \widehat{\theta} je nestranný odhad veličiny \theta: E[\widehat{\theta}]=E[4/n\cdot N_1-2] =4/n\cdot E[N_1]-2 =4/n\cdot np_1-2 =4\cdot p_1-2 =4\cdot1/4\cdot(\theta+2)-2 =\theta+2-2 =\theta.
Vztahy mezi veličinami
Pro střední kvadratickou chybu (MSE), rozptyl, a vychýlenost platí: \operatorname{MSE}(\widehat{\theta}) = \operatorname{Var}(\widehat\theta) + (B(\widehat{\theta}))^2, tj. střední kvadratická chyba = rozptyl + druhá mocnina vychýlenosti. +more Díky tomu se u nestranného odhadu rozptyl rovná střední kvadratické chybě. * Směrodatná odchylka odhadu \widehat{\theta} parametru \theta (druhá odmocnina rozptylu) nebo odhad směrodatné odchylky odhadu \widehat{\theta} parametru \theta, se nazývá standardní chyba parametru \widehat{\theta}. * Kompromis mezi vychýleností a rozptylem se používá v modelové složitosti, over-fitting a under-fitting. Používá se především v oblasti učení s učitelem a pro prediktivní modelování pro diagnostiku výkonnosti algoritmů.
Behaviorální vlastnosti
Konzistence
Konzistentní posloupnost odhadů je posloupnost odhadů, které konverguje v pravděpodobnosti k odhadované veličině, když index (obvykle rozsah souboru) roste bez nade všechny meze. Jinými slovy, rostoucí velikost vzorku zvyšuje pravděpodobnost, že odhad je blízko k parametru populace.
Matematicky, posloupnost odhadů {tn; n ≥ 0} je konzistentním odhadem parametru θ právě tehdy, když pro všechna ε > 0 platí : \lim_{n\to\infty}\Pr\left\{ \left| t_n-\theta\right|.
Výše definovanou konzistenci můžeme nazývat slabou konzistencí. Posloupnost je silně konzistentní, pokud konverguje skoro jistě ke skutečné hodnotě.
Z odhadu, který konverguje k násobku parametru, lze udělat konzistentní odhad vynásobením odhadu škálovacím faktorem, konkrétně skutečnou hodnotou vydělenou asymptotickou hodnotou odhadu. K tomu často dochází při odhadu parametrů měřítka pomocí měr statistického rozptylu.
Asymptotická normalita
Asymptoticky normální odhad je konzistentní odhad, jehož rozdělení se v blízkosti skutečného parametru θ blíží normálnímu rozdělení se směrodatnou odchylkou klesající úměrně 1/\sqrt{n}, při rostoucí velikosti vzorku n. Pokud použijeme \xrightarrow{D} pro označení konvergence v rozdělení, pak tn je asymptoticky normální pokud :\sqrt{n}(t_n - \theta) \xrightarrow{D} N(0,V), pro některé V.
V této formulaci lze V/n nazývat asymptotický rozptyl odhadu. Někteří autoři však asymptotický rozptyl používají pro V. +more Všimněte si, že konvergence nutně nenastává pro libovolné konečné „n“, proto je tato hodnota pouze aproximací skutečného rozptylu odhadu, zatímco v limitě je asymptotický rozptyl (V/n) jednoduše nula. Podrobněji, rozdělení odhadu tn konverguje slabě k Diracovu delta se středem v \theta.
Centrální limitní věta implikuje asymptotickou normalitu výběrové střední hodnoty \bar X jako odhadu skutečné střední hodnoty. Obecněji odhady metodou maximální věrohodnosti jsou asymptoticky normální za dosti slabých podmínek regularity - viz asymptotická část článku o maximální věrohodnosti. +more Ne všechny odhady jsou však asymptoticky normální; nejjednodušším příkladem je, když skutečná hodnota parametru leží na hranice oblasti povolených parametrů.
Efektivita
Efektivita odhadu se používá pro odhad dané veličiny s „minimální chybou“. Ve skutečnosti neexistuje explicitně nejlepší odhad; existují pouze lepší metody odhadu. +more Kvalita a efektivita odhadu závisí na volba určité účelové funkce, a je odražený dvěma přirozeně žádoucími vlastnostmi odhadů: odhad by měl být nevychýlený \operatorname{E}(\widehat{\theta}) - \theta=0 a měl by mít minimální střední kvadratickou chybu (MSE) \operatorname{E}[(\widehat{\theta} - \theta )^2]. Obecně tyto dvě podmínky nemusí být splněny současně: nestranný odhad může mít nižší střední kvadratickou chybu než nějaký vychýlený odhad (viz vychýlenost odhadu). Funkce ukazuje souvislost střední kvadratické chyby s vychýleností odhadu.
\operatorname{E}[(\widehat{\theta} - \theta )^2]=(\operatorname{E}(\widehat{\theta}) - \theta)^2+\operatorname{Var}(\theta)\
První člen reprezentuje střední kvadratickou chybu; druhý člen reprezentuje druhou mocninu vychýlenosti odhadu; a třetí člen reprezentuje rozptyl vzorku. Kvalitu odhadu lze určit porovnáním rozptylu, druhé mocniny vychýlenosti odhadu nebo střední kvadratické chyby. +more Rozptyl dobrého odhadu (s dobrou efektivitou) by měl být menší než rozptyl špatného odhadu (se špatnou efektivitou). Druhá mocnina vychýlenosti odhadu je u dobrého odhadu menší než druhá mocnina vychýlenosti špatného odhadu. Střední kvadratická chyba dobrého odhadu je menší než střední kvadratická chyba špatného odhadu. Pokud předpokládáme, že existují dva odhady, dobrý odhad \theta_1 a špatný odhad \theta_2, pak výše uvedený vztah lze vyjádřit vzorcem:.
\operatorname{Var}(\theta_1)
|\operatorname{E}({\theta}_1) - \theta|
\operatorname{MSE}(\theta_1)
Efektivitu odhadu lze určit pomocí vzorce nebo pomocí grafu. Pokud je odhad efektivní, v grafu znázorňujícím závislost frekvence na hodnotě bude křivka s velkou frekvencí uprostřed a nízkými frekvencemi na obou stranách. +more Například: náhled Pokud odhad není efektivní, v grafu znázorňujícím závislost frekvence na hodnotě bude relativně mírnější křivka (pozor na jiné měřítko na ose y): náhled Jednoduše řečeno, dobrý odhad má úzkou křivku a špatný širokou křivku. Vynesením obou křivek do jednoho grafu se společnou osou y se rozdíl stane zřejmější: náhled.
Mezi nevychýlenými odhady často existuje odhad s nejmenším rozptylem, nazývaný nejlepší nestranný odhad (MVUE). V některých případech existuje nevychýlený efektivní odhad, který, kromě toho, že má nejmenší rozptyl mezi nevychýlenými odhady, vyhovuje Cramérově-Raově mezi, což je absolutní spodní mez rozptylu statistické proměnné.
Takovými „nejlepšími nevychýlenými odhady“ se zabývá také Cramérova-Raova mez, Gaussova-Markovova věta, Lehmannova-Scheffého věta, Raova-Blackwellova věta.
Robustnost
Odkazy
Reference
Literatura
Související články
Gaussova-Markovova věta (BLUE) * Invariantní odhad * Kálmánův filtr * Markov chain Monte Carlo (MCMC) * Maximální aposteriorní odhad (MAP) * Momentová metoda (statistika), zobecněná momentová metoda * Minimální střední kvadratická chyba (MMSE) * Částicový filtr * Pitmanovo kritérium uzavřenosti * Citlivost a specificita * Shrinkage odhad * Zpracování signálu * Testimátor * Wienerův filtr * Rozumná statistika
Externí odkazy
[url=https://web.archive.org/web/20200212200544/https://pdfs.semanticscholar.org/9abc/f28d04f550cc20c30ff819c3f0b8f110b808.pdf]Fundamentals on Estimation Theory[/url]