Cayleyho–Hamiltonova věta
Author
Albert FloresFRS (1821-1895) přední britský matematik 19. století. Cayley uvedl větu pro matice řádu nejvýše tři a publikoval důkaz pro řád dva. národní akademie věd. Cayleyho-Hamiltonova věta je matematické tvrzení z oboru lineární algebry pojmenované po Arthuru Cayleyovi a Williamu R. Hamiltonovi, které říká, že každá čtvercová matice nad komutativním okruhem (tedy speciálně například nad tělesem reálných čísel nebo tělesem komplexním čísel) je kořenem svého charakteristického polynomu.
Charakteristický polynom čtvercové matice \boldsymbol{A} řádu n je p_\boldsymbol{A}(\lambda)=\det(\lambda \mathbf{I}_n-\boldsymbol{A}), kde \det značí determinant, \lambda je skalární proměnná z příslušného okruhu a \mathbf{I}_n je jednotková matice řádu n. Každý prvek matice (\lambda \mathbf{I}_n-\boldsymbol{A}) je buď konstantní nebo lineární v \lambda , a proto je determinant (\lambda \mathbf{I}_n-\boldsymbol{A}) monický polynom stupně n v proměnné \lambda a lze jej zapsat výrazem p_\boldsymbol{A}(\lambda) = \lambda^n + c_{n-1}\lambda^{n-1} + \cdots + c_1\lambda + c_0. +more Záměna skalární proměnné \lambda za matici \boldsymbol{A} dává analogický maticový mnohočlen p_\boldsymbol{A}(\boldsymbol{A}) = \boldsymbol{A}^n + c_{n-1}\boldsymbol{A}^{n-1} + \cdots + c_1\boldsymbol{A} + c_0\mathbf{I}_n. (Zde \boldsymbol{A} je daná matice a nikoli proměnná, na rozdíl od \lambda, a tudíž p_\boldsymbol{A}(\boldsymbol{A}) je spíše maticová konstanta než funkce. ) Cayleyho−Hamiltonova věta uvádí, že tento polynomický výraz je roven nulové matici, což lze formálně zapsat jako: p_\boldsymbol{A}(\boldsymbol{A}) = \boldsymbol 0.
Cayleyho−Hamiltonova věta mimo jiné umožňuje vyjádřit \boldsymbol{A}^n jako lineární kombinaci nižších mocnin matice \boldsymbol{A}, konkrétně \boldsymbol{A}^n = -c_{n-1}\boldsymbol{A}^{n-1} - \cdots - c_1\boldsymbol{A} - c_0\mathbf{I}_n. V případě těles Cayleyho−Hamiltonova znamená, že charakteristický polynom matice je dělitelný jejím minimálním polynomem.
Za zobecnění Cayleyho−Hamiltonovy věty lze pokládat Nakajamovo lemma.
Ukázky
Matice řádu 1
Charakteristický polynom matice \boldsymbol{A}=(a) je p_{\boldsymbol A}(\lambda) = \lambda - a, a proto p_{\boldsymbol A}(\boldsymbol{A}) = (a) - a(1) = 0.
Matice řádu 2
Konkrétní matice \boldsymbol{A} = \begin{pmatrix}1&2\\3&4\end{pmatrix} má charakteristický polynom: : p_\boldsymbol{A}(\lambda) = \det(\lambda \mathbf{I}_2-\boldsymbol{A}) = \det\! \begin{pmatrix} \lambda-1 & -2 \\ -3 & \lambda-4 \end{pmatrix} = (\lambda-1)(\lambda-4)-(-2)(-3) = \lambda^2-5\lambda-2
Cayleyho-Hamiltonova věta uvádí, že pro maticový polynom definovaný p_{\boldsymbol{A}}(\boldsymbol{X}) = \boldsymbol{X}^2 - 5\boldsymbol{X} - 2\mathbf{I}_2 platí: p_{\boldsymbol{A}}(\boldsymbol{A}) = \boldsymbol{0} , což lze potvrdit následujícím výpočtem:
:p_{\boldsymbol{A}}(\boldsymbol{A}) = \boldsymbol{A}^2-5\boldsymbol{A}-2\mathbf{I}_2 = \begin{pmatrix}7&10\\15&22\\\end{pmatrix} - \begin{pmatrix}5&10\\15&20\\\end{pmatrix} - \begin{pmatrix}2&0\\0&2\\\end{pmatrix} = \begin{pmatrix}0&0\\0&0\\\end{pmatrix}.
Obecná matice \boldsymbol{A}=\begin{pmatrix}a&b\\c&d\\\end{pmatrix}, má charakteristický polynom p_{\boldsymbol{A}}(\lambda) = \lambda^{2} - (a + d)\lambda + (ad - bc). Platnost Cayleyho−Hamiltonovy věty lze v tomto případě ověřit přímo:
:\begin{align} p_{\boldsymbol{A}}(\boldsymbol{A})&= \boldsymbol{A}^2-(a+d)\boldsymbol{A}+(ad-bc)\mathbf{I}_2 \\[1ex] &= \begin{pmatrix}a^2+bc&ab+bd\\ac+cd&bc+d^2\\\end{pmatrix} - \begin{pmatrix}a(a+d)&b(a+d)\\c(a+d)&d(a+d) \end{pmatrix} + \begin{pmatrix}ad-bc&0\\0&ad-bc\end{pmatrix}\\[1ex] &= \begin{pmatrix}0&0\\0&0 \end{pmatrix} \end{align}
Aplikace
Mocniny matice
Cayleyho−Hamiltonova věta poskytuje vztah mezi mocninami \boldsymbol{A} (ačkoli ne vždy ten nejjednodušší), což umožňuje zjednodušit výrazy obsahující vyšší mocniny a vyhodnotit je, aniž by bylo nutné počítat \boldsymbol{A}^n nebo jakoukoli vyšší mocninu \boldsymbol{A}.
Například pro \boldsymbol{A} = \begin{pmatrix}1&2\\3&4\end{pmatrix} platí podle věty \boldsymbol{A}^2=5\boldsymbol{A}+2\mathbf{I}_2. Pro výpočet \boldsymbol{A}^{4} lze v důsledku věty využít vztahy: :\begin{align} \boldsymbol{A}^3&=(5\boldsymbol{A}+2\mathbf{I}_2)\boldsymbol{A}=5\boldsymbol{A}^2+2\boldsymbol{A}=5(5\boldsymbol{A}+2\mathbf{I}_2)+2\boldsymbol{A}=27\boldsymbol{A}+10\mathbf{I}_2 \\[1ex] \boldsymbol{A}^4&=\boldsymbol{A}^3\boldsymbol{A}=(27\boldsymbol{A}+10\mathbf{I}_2)\boldsymbol{A}=27\boldsymbol{A}^2+10\boldsymbol{A}=27(5\boldsymbol{A}+2\mathbf{I}_2)+10\boldsymbol{A}=145\boldsymbol{A}+54\mathbf{I}_2 \end{align}
Podobně lze počítat i inverzní matici a její mocniny:
:\begin{align} \boldsymbol{A}^{-1} &= \frac{1}{2}\left(\boldsymbol{A}-5\mathbf{I}_2\right)\\[1ex] \boldsymbol{A}^{-2} &= \boldsymbol{A}^{-1} \boldsymbol{A}^{-1} = \frac{1}{4} \left(\boldsymbol{A}^2-10\boldsymbol{A}+25\mathbf{I}_2\right) = \frac{1}{4} \left((5\boldsymbol{A}+2\mathbf{I}_2)-10\boldsymbol{A}+25\mathbf{I}_2\right) = \frac{1}{4} \left(-5\boldsymbol{A}+27\mathbf{I}_2\right) \end{align}
Ve všech uvedených případech bylo možné zapsat mocninu matice jako součet dvou členů. Ve skutečnosti lze libovolnou mocninu čtvercové matice řádu n zapsat jako maticový polynom stupně nejvýše n-1. +more Jinými slovy, dimenze prostoru generovaného mocninami čtvercové matice je shora omezena jejím řádem.
Maticové funkce
Je-li dána analytická funkce f(x) = \sum_{k=0}^\infty a_k x^k a matice \boldsymbol{A} řádu n s charakteristickým polynomem p_{\boldsymbol{A}}(x), a pokud lze funkci f(x) = q(x) p_{\boldsymbol A}x) + r(x) vyjádřit pomocí dlouhého dělení jako f(x) = q(x) p_{\boldsymbol{A}}(x) + r(x), kde q(x) je podílový polynom a r(x) je zbytkový polynom takový stupně nejvýše n-1, potom podle Cayleyho−Hamiltonovy věty, nahrazení x maticí \boldsymbol{A} dává p_{\boldsymbol{A}}(\boldsymbol{A}) = \boldsymbol{0}, takže v důsledku platí: f(\boldsymbol{A}) = r(\boldsymbol{A}). Maticovou analytickou funkci \boldsymbol{A} lze za uvedených předpokladů tudíž vyjádřit jako maticový polynom stupně nejvýše n-1.
Algebraická teorie čísel
Cayleyho−Hamiltonova věta je efektivním nástrojem pro výpočet minimálního polynomu algebraických čísel. Například pro konečné rozšíření \mathbb{Q}[\alpha_1,\ldots,\alpha_k] tělesa \mathbb{Q} a algebraické číslo \alpha \in \mathbb{Q}[\alpha_1,\ldots,\alpha_k], což je nenulová lineární kombinace \alpha_1^{n_1}\cdots\alpha_k^{n_k}, lze spočítat minimální polynom \alpha pomocí matice \boldsymbol{A} reprezentující lineární zobrazení na \mathbb{Q} dané předpisem:
:\cdot \alpha : \mathbb{Q}[\alpha_1,\ldots,\alpha_k] \to \mathbb{Q}[\alpha_1,\ldots,\alpha_k]
Minimální polynom lze odvodit použitím Cayleyho−Hamiltonovy věty pro matici \boldsymbol{A}.
Důkaz
Vlastní ověření platnosti Cayleyho−Hamiltonovy věty pro konkrétní matici \boldsymbol A řádu n vyžaduje dva kroky: Nejprve je třeba určit koeficienty c_{i} charakteristického polynomu v proměnné t coby rozvoj determinantu: :\begin{align} p_{\boldsymbol{A}}(t) & = \det(t \mathbf{I}_n - \boldsymbol{A}) = \begin{vmatrix}t-a_{11}&-a_{12}&\cdots&-a_{1n} \\ -a_{21}&t-a_{22}&\cdots&-a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ -a_{n1}&-a_{n2}& \cdots& t-a_{nn} \end{vmatrix} \\[5pt] & = t^n+c_{n-1}t^{n-1}+\cdots+c_1t+c_0, \end{align}
Poté se tyto koeficienty použijí v lineární kombinaci mocnin matice \boldsymbol{A} a ukáže se, že tato lineární kombinace je rovna nulové matici:
:\boldsymbol{A}^n+c_{n-1}\boldsymbol{A}^{n-1} + \cdots + c_1 \boldsymbol{A} + c_0 \mathbf{I}_n = \boldsymbol{0}.
Levou stranu této rovnosti lze vyjádřit jako matici řádu n, jejíž prvky jsou složité mnohočleny z prvků a_{ij} dané matice \boldsymbol{A}. Cayleyho−Hamiltonova věta tvrdí, že každý z těchto n^{2} výrazů je roven 0. +more Pro každou pevnou hodnotu n lze tyto identity získat zdlouhavými, ale přímočarými algebraickými úpravami, jak bylo například předvedeno výše pro matice řádu 2. Tyto výpočty však nemohou ukázat, proč by Cayleyho−Hamiltonova věta měla platit pro matice libovolných řádů n, a proto je zapotřebí odvodit jednotný obecný důkaz pro všechna možná n.
Adjungovaná matice
Obecné důkazy často využívají matici adjungovanou \operatorname{adj}(\boldsymbol{M}) k matici \boldsymbol{M} a její vlastnost:
: \boldsymbol{M}\cdot\operatorname{adj}(\boldsymbol{M}) =\det(\boldsymbol{M})\cdot\mathbf{I}_n
Uvedené vztahy vyplývají z úprav algebraických výrazů a platí pro matice s prvky i z libovolného komutativního okruhu. Jmenovitě platí nejen pro číselné matice, ale i pro matice, jejíž prvky tvoří polynomy, a právě tato vlastnost bude v důkazu využita.
Maticové polynomy
Determinant matice t\mathbf{I}_{n} -\boldsymbol{A} je charakteristický polynom matice \boldsymbol{A}. Matice \boldsymbol{B} daná výrazem:
:\boldsymbol{B}:=\operatorname{adj}(t\mathbf{I}_n-\boldsymbol{A})
má za prvky polynomy v proměnné t. Protože polynomy tvoří komutativní okruh, lze dosazením t\mathbf{I}_{n} -\boldsymbol{A} za \boldsymbol{M} do výše uvedeného vztahu pro adjungovanou matici odvodit rovnost:
:(t \mathbf{I}_n - \boldsymbol{A})\boldsymbol{B} = \det(t \mathbf{I}_n - \boldsymbol{A}) \mathbf{I}_n = p_{\boldsymbol A}(t) \mathbf{I}_n
Polynomy, které se vyskytují jako prvky matice \boldsymbol{B} lze rozložit na monomy a jejich koeficienty roztřídit do již číselných matic \boldsymbol{B}_0,\boldsymbol{B}_1,\dots,\boldsymbol{B}_{n-1} tak, že matice \boldsymbol{B}_i obsahuje koeficienty u t^i. Takto zvolené matice splňují:
:\boldsymbol{B} = \sum_{i = 0}^{n-1} t^i \boldsymbol{B}_i
Levou strana rovnosti lze algebraicky upravit na následující maticový mnohočlen v proměnné t:
:\begin{align} (t \mathbf{I}_n - \boldsymbol{A})\boldsymbol{B} &=(t \mathbf{I}_n - \boldsymbol{A})\sum_{i = 0}^{n - 1} t^i \boldsymbol{B}_i \\ &=\sum_{i = 0}^{n - 1} t\mathbf{I}_n\cdot t^i \boldsymbol{B}_i - \sum_{i = 0}^{n - 1} \boldsymbol{A}\cdot t^i \boldsymbol{B}_i \\ &=\sum_{i = 0}^{n - 1} t^{i + 1} \boldsymbol{B}_i- \sum_{i = 0}^{n - 1} t^i \boldsymbol{A}\boldsymbol{B}_i \\ &=t^n \boldsymbol{B}_{n - 1} + \sum_{i = 1}^{n - 1} t^i(\boldsymbol{B}_{i - 1} - \boldsymbol{A}\boldsymbol{B}_i) - \boldsymbol{A}\boldsymbol{B}_0 \end{align}
Podobně pravá strana dává maticový polynom:
:p_{\boldsymbol A}(t)\mathbf{I}_n=t^n\mathbf{I}_n+t^{n-1}c_{n-1}\mathbf{I}_n+\cdots+tc_1\mathbf{I}_n+c_0\mathbf{I}_n
Rovnost obou stran platí, právě když se shodují všechny dvojice polynomů na stejných pozicích v maticích na obou stranách. Tudíž se na obou stranách musejí shodovat i matice u libovolné mocniny t^{i}. +more Jednotlivým mocninám i od n do 0, odpovídají rovnosti:.
:\boldsymbol{B}_{n - 1} = \mathbf{I}_n, \qquad \boldsymbol{B}_{i - 1} - \boldsymbol{A}\boldsymbol{B}_i = c_i \mathbf{I}_n\quad \text{pro }1 \leq i \leq n-1, \qquad -\boldsymbol{A} \boldsymbol{B}_0 = c_0 \mathbf{I}_n
Vynásobení těchto rovností zleva příslušnou mocninou matice \boldsymbol{A} (čili první je vynásobena zleva \boldsymbol{A}^n a podobně ostatní rovnosti odpovídající t^{i} jsou zleva vynásobeny \boldsymbol{A}^{i}) a sečtení všech těchto rovnic do jedné dává:
:\boldsymbol{A}^n \boldsymbol{B}_{n-1} + \sum\limits_{i=1}^{n-1}\left( \boldsymbol{A}^i \boldsymbol{B}_{i-1} - \boldsymbol{A}^{i+1}\boldsymbol{B}_i\right) -\boldsymbol{A} \boldsymbol{B}_0 = \boldsymbol{A}^n+c_{n-1} \boldsymbol{A}^{n-1} + \cdots + c_1\boldsymbol{A} + c_0\mathbf{I}_n
Po rozepsání součtu se po sobě jdoucí dvojice členů na levé straně se navzájem odečtou, zatímco pravá strana odpovídá dosazení matice \boldsymbol{A} do svého charakteristického mnohočlenu p_\boldsymbol{A}(\boldsymbol{A}). Z uvedeného vyplývá vztah: \boldsymbol{0}=p_\boldsymbol{A}(\boldsymbol{A}) čímž je důkaz Cayleyho-Hamiltonovy věty dokončen.
Ukázka
Matice \boldsymbol{A}= \begin{pmatrix} 1 & 2 & 0 \\ 3 & -1 & 3 \\ 1 & -2 & 2 \\ \end{pmatrix} má charakteristický mnohočlen p_\boldsymbol{A}(t) = t^3-2t^2-t+2 , a proto platí i maticová rovnost:
:p_{\boldsymbol A}(t)\mathbf{I}_3=t^3\mathbf{I}_3-2t^2\mathbf{I}_3-t\mathbf{I}_3+2\mathbf{I}_3
Adjungovaná matice k matici t\mathbf{I}_{n} -\boldsymbol{A} je následující polynomiální matice \boldsymbol{B}. Ta je dále rozložena na tři matice koeficientů:
: \begin{align} \boldsymbol{B} &=\operatorname{adj}(t\mathbf{I}_3-\boldsymbol{A}) =\operatorname{adj} \left( \begin{pmatrix} t-1 & -2 & 0 \\ -3 & t+1& -3 \\ -1 & 2 & t-2 \\ \end{pmatrix} \right) \\ &= \begin{pmatrix} t^2-t+4 & 2t-4 & 6 \\ 3t-3 & t^2-3t+2& 3t-3 \\ t-5 & -2t+4 & t^2-7 \\ \end{pmatrix} \\ & = t^2 \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \\ \end{pmatrix} + t \begin{pmatrix} -1 & 2 & 0 \\ 3 & -3& 3 \\ 1 & -2 & 0 \\ \end{pmatrix} + \begin{pmatrix} 4 & -4 & 6 \\ -3 & 2 & -3 \\ -5 & 4 & -7 \\ \end{pmatrix} \\ &=t^2\boldsymbol{B}_2+t\boldsymbol{B}_1+\boldsymbol{B}_0 \end{align}
Z vlastností adjungované matice vyplývá, že tyto tři matice koeficientů splňují:
: (t \mathbf{I}_3 - \boldsymbol{A})\boldsymbol{B} = t^3 \boldsymbol{B}_2 + t^2(\boldsymbol{B}_1-\boldsymbol{A}\boldsymbol{B}_2) + t(\boldsymbol{B}_0 - \boldsymbol{A}\boldsymbol{B}_1) - \boldsymbol{A}\boldsymbol{B}_0
Protože (t \mathbf{I}_n - \boldsymbol{A})\boldsymbol{B} = p_{\boldsymbol A}(t) \mathbf{I}_n, musí platit také:
:\boldsymbol{B}_2 = \mathbf{I}_3, \qquad \boldsymbol{B}_1-\boldsymbol{A}\boldsymbol{B}_2= -2\mathbf{I}_3, \qquad \boldsymbol{B}_0-\boldsymbol{A}\boldsymbol{B}_1= -\mathbf{I}_3, \qquad -\boldsymbol{A} \boldsymbol{B}_0 = 2 \mathbf{I}_3
Vynásobení těchto rovností příslušnými mocninami matice \boldsymbol{A} zleva a celkové sečtení dává kýžený vztah:
:\boldsymbol{A}^3\boldsymbol{B}_2 + \boldsymbol{A}^2(\boldsymbol{B}_1-\boldsymbol{A}\boldsymbol{B}_2)+ \boldsymbol{A}(\boldsymbol{B}_0-\boldsymbol{A}\boldsymbol{B}_1) - \boldsymbol{A}\boldsymbol{B}_0 = \boldsymbol{0} =\boldsymbol{A}^3-2\boldsymbol{A}^2-\boldsymbol{A}+2\mathbf{I}_3
Historie
Hamilton dokázal speciální případ věty v roce 1853 v termínech inverzí lineárních funkcí kvaternionů, což odpovídá speciálnímu případu reálných matic řádu, resp. komplexních matic řádu 2. +more Cayley v roce 1858 uvedl výsledek pro matice řádu nejvýše 3, ale důkaz publikoval pouze pro řád 2. Pokud jde o matice řádu n Cayley uvedl: ". , nepovažoval jsem za nutné pustit se do práce s formálním důkazem věty v obecném případě matice libovolného stupně". Obecný případ poprvé dokázal Ferdinand Frobenius v roce 1878.