Korelace

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

Korelace (z lat. souvztažnost) znamená vzájemný vztah mezi dvěma procesy nebo náhodnými veličinami. Pokud se jedna z náhodných veličin mění, mění se i druhá a naopak. Pokud se mezi dvěma procesy ukáže korelace, je pravděpodobné, že na sobě závisejí, nelze z toho však ještě usoudit, že by jeden z nich musel být příčinou a druhý následkem. To samotná korelace nedovoluje rozhodnout, protože korelace neimplikuje kauzalitu a ani směr kauzality.

V statistice se pojem korelace užívá pro vyjádření lineárního vztahu mezi veličinami x a y. Sílá korelace pak vyjadřuje korelační koeficient, který nabývá hodnotu mezi −1 a +1.

Korelace ve statistice

+more1|vpravo'>Na obrázku je několik příkladů grafického zobrazení dat a koeficienty jejich korelace s funkcí y = x Vztah mezi znaky či náhodnými veličinami X a Y může být kladný, pokud (přibližně) platí Y = kX, nebo záporný (Y = -kX). Hodnota korelačního koeficientu −1 značí zcela nepřímou závislost (antikorelaci), tedy čím více se zvětší hodnoty v první skupině znaků, tím více se zmenší hodnoty v druhé skupině znaků, např. vztah mezi uplynulým a zbývajícím časem. Hodnota korelačního koeficientu +1 značí zcela přímou závislost, např. vztah mezi rychlostí bicyklu a frekvencí otáček kola bicyklu. Pokud je korelační koeficient roven 0 (nekorelovanost), pak mezi znaky není žádná statisticky zjistitelná lineární závislost. Je dobré si uvědomit, že i při nulovém korelačním koeficientu na sobě veličiny mohou záviset, pouze tento vztah nelze vyjádřit lineární funkcí, a to ani přibližně.

Pearsonovův korelační koeficient

Pearsonův korelační koeficient je definován, pokud jsou druhé mocniny náhodných veličin X a Y E(X^2),E(Y^2) konečné. Je založen na myšlence, že kovarianci normujeme na bezrozměrné číslo tak nabývající hodnoty mezi -1 a 1, že ji podělíme směrodatnými odchylkami obou proměnných:

:\rho_{X,Y}={\mathrm{cov}(X,Y) \over \sigma_X \sigma_Y} ={E((X-\mu_X)(Y-\mu_Y)) \over \sigma_X\sigma_Y},

Protože \mu_X = E(X) , \sigma^2_X = E(X^2) - E^2(X) a obdobně pro Y, lze výše uvedený vzorec upravit do přehlednějšího výpočetního tvaru:

:\rho_{X,Y}=\frac{E(XY)-E(X)E(Y)}{\sqrt{E(X^2)-E^2(X)}~\sqrt{E(Y^2)-E^2(Y)}}

Koeficient korelace nabývá hodnot z intervalu \langle -1,1\rangle. Při nezávislosti náhodných veličin X a Y je koeficient korelace roven 0. +more Nulový korelační koeficient však neznamená, že jsou náhodné veličiny X a Y nezávislé. Nulový korelační koeficient má například dvojice náhodných veličin X a Y=X^2.

Tento koeficient jako první odvodil anglický psycholog a antropolog sir Francis Galton.

Existují nicméně i jiné koeficienty korelace, například Spearmanovo rhó či Kendallovo tau pro ordinální (pořadová) data.

Korelace v teorii signálů

:

Zkrácený výraz pro korelační funkci.

Pro spojité signály f(t) a g(t) :

:(f \star g)(t) \ \stackrel{\mathrm{def}}{=} \int_{-\infty}^{\infty} f^*(\tau) \cdot g(t+\tau)\,{\rm d}\tau

Pro diskrétní signály f_k a g_k:

:(f \star g)_k \ \stackrel{\mathrm{def}}{=} \sum_{i=-\infty}^{\infty} f^*_i \ g_{k+i}

U komplexních signálů f^* představuje komplexně sdružené číslo k f.

Velmi se podobá konvoluci. Rozdíl je hlavně v časovém překlopení druhé funkce g.

Jako autokorelace se rozumí korelace (f \star f). Lze tak určit tzv. soběpodobnost signálu, tedy zda se např. signál v určitých periodách neopakuje.

Externí odkazy

Kategorie:Statistika

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top