Analýza hlavních komponent

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

Analýza hlavních komponent (', PCA') je v teorii signálu transformace sloužící k dekorelaci dat. Často se používá ke snížení dimenze dat s co nejmenší ztrátou informace. PCA je možno najít také jako Karhunen-Loèveho transformaci, Hotellingovu transformaci, nebo jako singulární rozklad (SVD; v lineární algebře).

Z následujícího vzorce je vidět, že PCA je jen přepsáním vstupu do jiné souřadné soustavy:

Y = X P

kde X je centrovaná matice n x d se vstupními d-rozměrnými daty v n řádcích, Y obdobná matice výstupních dat, P je d x d matice vlastních vektorů kovarianční matice C_X splňující vztah C_X = P \Lambda P^T, kde \Lambda je diagonální matice obsahující na diagonále vlastní čísla C_X a matice vlastních vektorů P je ortonormální, tj. P^T P = I_d, kde I_d je jednotková matice dimenze d.

Vlastní vektory (sloupce matice P) tvoří onu novou souřadnou soustavu. Centrování matice X dosáhneme odečtením příslušného výběrového průměru od každého sloupce.

Odvození

Matice Y je zřejmě také centrovaná, tj. aritmetický průměr každého jejího sloupce je 0.

Spočítáme, jak musí vypadat kovarianční matice nových dat Y:

C_Y = E(Y^T Y) = E[(X P)^T (XP)] = E (P^T X^T X P) = P^T E(X^T X) P = P^T C_X P = P^T P \Lambda P^T P = \Lambda.

Vzhledem k tomu, že matice \Lambda je diagonální,

C_Y = \Lambda = \left ( \begin{matrix} \lambda_1 & & \\ & \ddots & \\ & & \lambda_d \\ \end{matrix}\right ),

vidíme, že sloupce matice Y jsou nekorelované a výběrový rozptyl každého sloupce se rovná příslušnému vlastnímu číslu.

Použití

Seřadíme-li vlastní vektory v P podle velikosti vlastních čísel \lambda_i, budeme dostávat složky v Y setříděné podle rozptylu. Pokud chceme snížit dimenzi dat, stačí z Y vzít jen tolik prvních složek kolik uznáme za vhodné. +more Vybírání komponenty s největším rozptylem nemusí být vždy nejlepší. Například pokud máme rozpoznávat třídy, které se liší právě ve složkách s malým rozptylem, které tímto postupem zahodíme.

Rozpoznávání

V rozpoznávání slouží PCA jako jedna z tzv. Feature Extraction metod (extrakce rysů). +more Používají ji například kriminalisté pro rozpoznávání obličejů.

Komprese

Jednoduchá komprese barevného nebo multispektrálního obrazu. Využívá vysoké korelace mezi jednotlivými spektrálními kanály a převede obrázek pomocí PCA na jednu nebo několik málo složek s většinou informace.

Odkazy

Související články

singulární rozklad * samoorganizující síť

Reference

Externí odkazy

http://www. cs. +moreotago. ac. nz/cosc453/student_tutorials/principal_components. pdf - jednoduché vysvětlení PCA spolu s matematickým základem * https://web. archive. org/web/20040809034742/http://robotics. eecs. berkeley. edu/~rvidal/cvpr03-gpca-final. pdf - vysvětlení pokročilejší zobecněné PCA * [url=https://web. archive. org/web/20070318013042/http://www. reindeergraphics. com/foveapro/pca. shtml]Příklady využití analýzy hlavních komponent na zřetelnější zobrazení struktur u grafických souborů[/url] (anglicky).

Kategorie:Statistika Kategorie:Strojové učení Kategorie:Zpracování obrazu

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top