Kolmogorovův–Smirnovův test

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

Kolmogorovův-Smirnovův test je metoda matematické statistiky, která umožňuje testovat, zda dvě jednorozměrné náhodné proměnné pocházejí ze stejného rozdělení pravděpodobnosti, případně zda jedna jednorozměrná náhodná proměnná má předpokládané (teoretické) rozdělení. Autory metody jsou Andrej Nikolajevič Kolmogorov a Vladimir Ivanovič Smirnov. Existují dvě verze tohoto testu: jednovýběrový a dvouvýběrový.

Test pro jeden výběr Jednovýběrový test ověřuje, zda se rozdělení náhodné veličiny v populaci liší od určitého teoretického rozdělení. Využívá se například pro ověření, zda má proměnná normální rozdělení.

Nulová hypotéza předpokládá, že testovaný výběr odpovídá vybranému teoretickému rozložení. Vstupem této varianty testu je k tříd testovaného výběru a předpokládané teoretické rozdělení, které se rozdělí do stejného počtu tříd. +more Nad každou třídou testovaného výběru se spočítají četnosti n_{1i} a nad každou třídou teoretického rozdělení se spočítají četnosti n_{2i}. Dále se hodnotí rozdíl kumulativních četností pro výběr N_{1i} = \sum_{j=1}^{i} n_{1j} a pro testované rozdělení N_{2i} = \sum_{j=1}^{i} n_{2j}. Hodnoceným kritériem je pak : D_1 = \frac{1}{n} \max_i | N_{1i} - N_{2i} |\,, kde n je celkový počet prvků výběru. Hodnota kritéria D_1 se porovná s kritickou hodnotou D_{1max} pro danou hladinu významnosti α. Tato kritická hodnota bývá pro n \le 40 tabelována (např. [url=https://web. archive. org/web/20100806192535/http://www. eridlc. com/onlinetextbook/index. cfm. fuseaction=textbook. appendix&FileName=Table7]zde[/url]), pro n > 40 se spočítá podle následující tabulky.

Hladina významnosti αD1max
20 %\frac{1. 07}{\sqrt{n}}
10 %\frac{1. +more22}{\sqrt{n}}
5 %\frac{1. 36}{\sqrt{n}}
2 %\frac{1. 52}{\sqrt{n}}
1 %\frac{1. 63}{\sqrt{n}}
.

Jestliže je hodnota kritéria D_1 větší než kritická, nulová hypotéza se zamítá.

Test pro dva výběry Dvouvýběrový test srovnává rozdělení dvou náhodných veličin. Je to jedna z nejpoužívanějších a nejvšeobecnějších neparametrických metod porovnávání dvou výběrů.

Nulová hypotéza říká, že dva výběry odpovídají stejnému rozdělení. V této variantě testu se srovnává rozdíl kumulativních četností (n \le 40) nebo relativních kumulativních četností (n > 40) dvou výběrů (kde n_1, n_2 jsou celkové počty prvků výběru). +more Relativní kumulativní četnosti se spočítají jako F_{1i} = \frac{1}{n} N_{1i} resp. F_{2i} = \frac{1}{n} N_{2i}. Hodnoceným kritériem je : D_2 = \max_i | N_{1i} - N_{2i} |\, resp. D_2 = \max_i | F_{1i} - F_{2i} |\,.

Kritické hodnoty se pro danou hladinu významnosti α určí z následující tabulky.

Hladina významnosti αD2max
20 %1. 07\sqrt{\frac{n_1+n_2}{n_1n_2}}
10 %1. +more22\sqrt{\frac{n_1+n_2}{n_1n_2}}
5 %1. 36\sqrt{\frac{n_1+n_2}{n_1n_2}}
2 %1. 52\sqrt{\frac{n_1+n_2}{n_1n_2}}
1 %1. 63\sqrt{\frac{n_1+n_2}{n_1n_2}}
.

Jako v předchozí variantě platí, že nulová hypotéza se zamítá, jestliže je hodnota kritéria D_2 větší než kritická D_{2max}. V opačném případě se nezamítá.

Literatura

Jaromír Baštinec: Statistika, operační výzkum, stochastické procesy. Skripta FEKT VUT v Brně, Brno 2009.

Kategorie:Testování statistických hypotéz

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top