Násobení matic
Author
Albert Floresnáhled Součin matic hovorově též maticové násobení (neplést se skalárním násobkem matice) je v matematice zobecnění součinu čísel na matice. Formálně se dá definovat jako binární operace na maticích odpovídajících typů. Využívá se v matematice, fyzice a jejich aplikacích, obvykle pro popis skládání lineárních zobrazení.
Speciálním případem násobení matic je součin matice typu m\times n a vektoru braného jako matice o typu n\times 1 (sloupcový vektor). Tento součin lze interpretovat jako aplikaci lineárního zobrazení reprezentovaného transformační maticí na vektor.
Formální definice
Pokud je \boldsymbol A matice typu m\times n a \boldsymbol B je matice typu n\times p, jejich součin \boldsymbol A \cdot \boldsymbol B je matice typu m\times p definovaná vztahem
: (\boldsymbol A\cdot \boldsymbol B)_{ij} = \sum_{k=1}^n a_{ik}b_{kj} = a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{in}b_{nj}.
pro všechny prvky výsledné matice indexované i\in\{1,\dots,m\} a j\in\{1,\dots,p\}.
Ve většině případů jsou prvky matice čísla, ale mohou to být jakékoli druhy matematických objektů, pro které je definováno sčítání a násobení, které jsou asociativní a takové, že sčítání je komutativní a násobení je distributivní s ohledem na sčítání, typicky prvky nějakého tělesa. Prvky mohou být dokonce samotné matice (bloková matice).
U reálných matic lze prvek v i-tém řádku a j-tém sloupci výsledné matice lze také chápat jako standardní skalární součin vektoru i-tého řádku první matice s vektorem j-tého sloupce druhé matice.
Tečka \cdot se v součinu vynechává a píše se pouze \boldsymbol{AB}.
Ukázka výpočtu
Součin matic \boldsymbol{A}= \begin{pmatrix} \color{blue}1 & \color{blue}2 & \color{blue}3 \\ \color{orange}4 & \color{orange}5 & \color{orange}6 \\ \end{pmatrix} a \boldsymbol{B}= \begin{pmatrix} \color{red}1 & \color{green}2 \\ \color{red}3 & \color{green}4 \\ \color{red}5 & \color{green}6 \\ \end{pmatrix} je : \boldsymbol{AB}=\begin{pmatrix} ({\color{blue}1} \cdot {\color{red}1}+{\color{blue}2} \cdot {\color{red}3}+{\color{blue}3} \cdot {\color{red}5}) & ({\color{blue}1} \cdot {\color{green}2}+{\color{blue}2} \cdot {\color{green}4}+{\color{blue}3} \cdot {\color{green}6})\\ ({\color{orange}4} \cdot {\color{red}1}+{\color{orange}5} \cdot {\color{red}3}+{\color{orange}6} \cdot {\color{red}5}) & ({\color{orange}4} \cdot {\color{green}2}+{\color{orange}5} \cdot {\color{green}4}+{\color{orange}6} \cdot {\color{green}6})\\ \end{pmatrix}= \begin{pmatrix} 22 & 28\\ 49 & 64 \end{pmatrix}
Prvky matice \boldsymbol A zůstávají v řádcích tak, jak jsou, a prvky v matici \boldsymbol B se rozmístí opět do levého a pravého sloupce.
Použití
Historicky bylo násobení matic zavedeno pro usnadnění a objasnění výpočtů v lineární algebře. Tento silný vztah mezi maticovým součinem a lineární algebrou zůstává je fundamentální v celé matematice, stejně jako ve fyzice, chemii, inženýrství a informatice.
Soustavy lineárních rovnic
Obecný tvar soustavy lineárních rovnic je : \begin{array}{rcr} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n &=& b_1 \\ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n &=& b_2 \\ &\vdots& \\ a_{m1}x_1 + a_{m2}x_2 + \dots + a_{mn}x_n &=& b_m \\ \end{array}
Při použití stejné notace jako výše je zápis soustavy ekvivalentní jednoduché maticové rovnici :\boldsymbol{Ax}=\boldsymbol b.
Lineární zobrazení
Pokud má vektorový prostor konečnou bázi, každý z jeho vektorů je jednoznačně reprezentován konečnou posloupností skalárů, nazývanou vektor souřadnic, tvořenou souřadnicemi vektoru vzhledem k bázi. Tyto vektory souřadnic tvoří další vektorový prostor, který je izomorfní původnímu vektorovému prostoru. +more Vektor souřadnic je běžně zapisován jako sloupcový vektor, což je matice pouze s jedním sloupcem. Sloupcový vektor pak představuje jak souřadnicový vektor, tak i vektor původního vektorového prostoru.
Lineární zobrazení A prostoru dimenze n do vektorového prostoru dimenze m převádí sloupcový vektor :\boldsymbol x=\begin{pmatrix}x_1 \\ x_2 \\ \vdots \\ x_n\end{pmatrix} na sloupcový vektor :\boldsymbol y= A(\boldsymbol x)= \begin{pmatrix}a_{11}x_1+\cdots + a_{1n}x_n\\ a_{21}x_1+\cdots + a_{2n}x_n \\ \vdots \\ a_{m1}x_1+\cdots + a_{mn}x_n\end{pmatrix}. Lineární zobrazení A je proto definováno maticí :\boldsymbol{A}=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix}, a zobrazuje sloupcový vektor \boldsymbol x na maticový součin :\boldsymbol y = \boldsymbol {Ax}.
Je-li B další lineární zobrazení z předchozího vektorového prostoru dimenze m, do vektorového prostoru dimenze p, pak jej lze reprezentovat maticí \boldsymbol B řádu p\times m. Přímý výpočet ukazuje, že matice složeného zobrazení B\circ A je rovna součinu \boldsymbol {BA}. +more Obecný vzorec (B\circ A)(\boldsymbol x) = B(A(\boldsymbol x)), který definuje složené zobrazení, je jedním z specifických případů asociativity maticového součinu: :(\boldsymbol{BA})\boldsymbol x = \boldsymbol{B}(\boldsymbol {Ax}) = \boldsymbol{BAx}.
Geometrické rotace
Při použití systému kartézských souřadnic v euklidovské rovině je rotace o úhel \alpha kolem počátku (počátek odpovídá nulovému vektoru) lineární zobrazení. Přesněji,
\begin{pmatrix} x' \\ y' \end{pmatrix} = \begin{pmatrix} \cos \alpha & - \sin \alpha \\ \sin \alpha & \cos \alpha \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix}, kde výchozí bod (x,y) i jeho obraz (x',y') jsou zapsány jako sloupcové vektory.
Složení rotací o úhel \alpha a pak o úhel \beta odpovídá maticovému součinu
\begin{pmatrix} \cos \beta & - \sin \beta \\ \sin \beta & \cos \beta \end{pmatrix} \begin{pmatrix} \cos \alpha & - \sin \alpha \\ \sin \alpha & \cos \alpha \end{pmatrix} = \begin{pmatrix} \cos \beta \cos \alpha - \sin \beta \sin \alpha & - \cos \beta \sin \alpha - \sin \beta \cos \alpha \\ \sin \beta \cos \alpha + \cos \beta \sin \alpha & - \sin \beta \sin \alpha + \cos \beta \cos \alpha \end{pmatrix} = \begin{pmatrix} \cos (\alpha+\beta) & - \sin(\alpha+\beta) \\ \sin(\alpha+\beta) & \cos(\alpha+\beta) \end{pmatrix},
ve druhé rovnosti jsou použity součtové vzorce. Výsledné složení odpovídá rotaci o úhel \alpha+\beta, jak lze očekávat.
Skalární součin, bilineární forma a seskvilineární forma
Standardní skalární součin dvou reálných sloupcových vektorů lze zapsat maticovým součinem :\boldsymbol x^\mathsf T \boldsymbol y, kde \boldsymbol x^\mathsf T je řádkový vektor získaný pomocí transpozice \boldsymbol x. (Výsledná matice 1\times 1 je zde ztotožněna se svým jediným prvkem. +more).
Obecněji lze jakoukoli bilineární formu ve vektorovém prostoru konečného rozměru vyjádřit jako maticový součin :\boldsymbol x^\mathsf T \boldsymbol {Ay}, a jakoukoliv seskvilineární formu lze vyjádřit jako :\boldsymbol x^{\mathsf H} \boldsymbol {Ay}, kde \boldsymbol x^{\mathsf H} je hermitovsky sdružený vektor k vektoru \boldsymbol x.
Alokace zdrojů v ekonomii
Jako příklad si představme fiktivní továrnu, která používá 4 druhy surovin b_1, b_2, b_3, b_4 k výrobě 3 meziproduktů, m_1, m_2, m_3, které se následně používají k výrobě 3 druhů výrobků, f_1, f_2, f_3.
Matice \boldsymbol{A} = \begin{pmatrix} 1 & 0 & 1 \\ 2 & 1 & 1 \\ 0 & 1 & 1 \\ 1 & 1 & 2 \\ \end{pmatrix} a \boldsymbol{B} = \begin{pmatrix} 1 & 2 & 1 \\ 2 & 3 & 1 \\ 4 & 2 & 2 \\ \end{pmatrix} udávají množství surovin potřebných pro výrobu meziproduktů, respektive množství meziproduktů potřebných pro výsledné výrobky. Například k výrobě jednoho meziproduktu m_1 je třeba jedna jednotka suroviny b_1, dvě jednotky b_2, žádné b_3 a jedna jednotka b_4, což odpovídá prvnímu sloupci matice \boldsymbol{A}.
Součin \boldsymbol{AB} = \begin{pmatrix} 5 & 4 & 3 \\ 8 & 9 & 5 \\\ 6 & 5 & 3 \\ 11 & 9 & 6 \\ \end{pmatrix} pak přímo udává množství surovin potřebných pro výrobu jednotlivých výrobků. Například prvek v levém dolním rohu \boldsymbol{AB} je vypočítán jako 1 \cdot 1 + 1 \cdot 2 + 2 \cdot 4 = 11, což odpovídá tomu, že 11 jednotek b_4 je potřeba k výrobě jednoho výrobku f_1. +more Jmenovitě jedna jednotka b_4 je třeba pro m_1, 2 pro m_2 a 4 pro každý ze dvou meziproduktů m_3, které jsou potřeba pro jeden kus f_1, viz obrázek.
Aby bylo možné vyrobit např. 100 výrobků f_1, 80 f_2 a 60 f_3, lze potřebné množství surovin vypočítat jako :(\boldsymbol{AB}) \begin{pmatrix} 100 \\ 80 \\ 60 \\ \end{pmatrix} = \begin{pmatrix} 1000 \\ 1820 \\ 1180 \\ 2180 \end{pmatrix} , tj. +more 1000 jednotek b_1, 1820 jednotek b_2, 1180 jednotek b_3 a 2180 jednotek b_4. Matice součinu \boldsymbol{AB} může být použita k výpočtu množství surovin i pro jiné počty výrobků.
Vlastnosti
Rovnosti uvedené v následujících odstavcích platí, pokud mají výsledky operací smysl.
* Součin matice \boldsymbol{A} s jednotkovou maticí \mathbf{I} zprava i zleva má za výsledek matici \boldsymbol{A}, tj. \mathbf{I} \boldsymbol{A} = \boldsymbol{A} \mathbf{I} = \boldsymbol{A}. +more * Maticový součin je asociativní, tedy \boldsymbol{A} (\boldsymbol{B} \boldsymbol{C}) =(\boldsymbol{A} \boldsymbol{B}) \boldsymbol{C}. * Maticový součin není komutativní, tedy existují příklady matic, pro něž platí \boldsymbol{AB} \neq\boldsymbol{BA}. * Maticový součin je distributivní vůči sčítání, tj. \boldsymbol{A}\left(\boldsymbol{B}+\boldsymbol{C}\right)= \boldsymbol{AB}+\boldsymbol{AC}. * Maticový součin je lineární vůči násobení skalárem (typicky reálné nebo komplexní číslo), tj. \boldsymbol{A} \left( c \boldsymbol{B} \right) = (c \boldsymbol{A}) \boldsymbol{B}=c(\boldsymbol{A}\boldsymbol{B}). * Matice vzhledem k součinu mohou být dělitelé nuly, tj. součin dvou nenulových matic může být nulová matice, například : \begin{pmatrix} 1 & 1 \\ 2 & 2 \end{pmatrix} \begin{pmatrix} -3 \\ 3 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \end{pmatrix} . * Součin matic \boldsymbol A typu m \times n a \boldsymbol B typu n \times p lze vyjádřit jako :\boldsymbol{AB}=\boldsymbol a_1\boldsymbol b_1^\mathsf T+\boldsymbol a_2\boldsymbol b_2^\mathsf T+\cdots+\boldsymbol a_n\boldsymbol b_n^\mathsf T, kde \boldsymbol a_1,\boldsymbol a_2,\dots, \boldsymbol a_n jsou sloupce matice \boldsymbol A a \boldsymbol b_1^\mathsf T,\boldsymbol b_2^\mathsf T,\dots, \boldsymbol b_n^\mathsf T řádky matice \boldsymbol B. (Neboli \boldsymbol b_1,\boldsymbol b_2,\dots, \boldsymbol b_n jsou sloupce \boldsymbol B^\mathsf T. ) Zde každý sčítanec \boldsymbol a_i\boldsymbol b_i^\mathsf T je matice typu m \times p, protože sloupcové vektory odpovídají maticím o jednom sloupci. * Transpozice součinu matic je součin transponovaných matic v opačném pořadí, tj. {(\boldsymbol{AB})}^{\mathsf T} = \boldsymbol{B}^{\mathsf T} \boldsymbol{A}^{\mathsf T} * Inverzní matice součinu regulárních matic je součin inverzních matic v opačném pořadí, tj. {(\boldsymbol{AB})}^{-1} = \boldsymbol{B}^{-1} \boldsymbol{A}^{-1} * Hermitovské sdružení (hermitovská transpozice) součinu matic je součin matic hermitovsky sdružených v opačném pořadí, tj. {(\boldsymbol{AB})}^{\mathsf H} = \boldsymbol{B}^{\mathsf H} \boldsymbol{A}^{\mathsf H} * Maticový součin odpovídá skládání lineárních zobrazení, které matice reprezentují.
Součiny čtvercových matic
Mocniny matice
Čtvercovou matici lze umocnit na jakoukoli nezápornou celočíselnou mocninu tím, že ji opakovaně násobíme stejným způsobem jako u běžných čísel, konkrétně :\boldsymbol{A}^0 = \mathbf{I}, :\boldsymbol{A}^1 = \boldsymbol{A}, :\boldsymbol{A}^k = \underbrace{\boldsymbol{A}\boldsymbol{A}\cdots\boldsymbol{A}}_{k\text{ krát}}.
Výpočet k-té mocniny matice potřebuje k-1 maticových součinů, pokud se provádí triviálním algoritmem (opakované násobení). Protože to může být velmi časově náročné, obecně se dává přednost použití umocňování pomocí druhé mocniny, které vyžaduje nejvýše \log_2 k maticových součinů, a je tedy mnohem efektivnější.
Snadným případem umocňování je diagonální matice. Protože součin diagonálních matic se rovná prostému vynásobení odpovídajících diagonálních prvků dohromady, získáme k-tou mocninu diagonální matice umocněním prvků na diagonále na k-tou: : \begin{pmatrix} a_{11} & 0 & \cdots & 0 \\ 0 & a_{22} & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_{nn} \end{pmatrix}^k = \begin{pmatrix} a_{11}^k & 0 & \cdots & 0 \\ 0 & a_{22}^k & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_{nn}^k \end{pmatrix}.
Regulární a singulární matice
Označme \mathcal M_n(R) množinu čtvercových matic řádu n s prvky z okruhu R, což je v praxi často těleso.
V \mathcal M_n(R) je součin definován pro každou dvojici matic. Toto dělá z \mathcal M_n(R) okruh, který má jednotkovou matici \mathbf{I} za neutrální prvek.
Pokud je n > 1, mnoho matic nemá inverzní prvek vůči násobení, např. nulová matice. +more Pokud inverzní prvek existuje, značí se \boldsymbol{A}^{-1} a nazývá se inverzní matice k matici \boldsymbol A. Splňuje: : \boldsymbol{A}\boldsymbol{A}^{-1} = \boldsymbol{A}^{-1}\boldsymbol{A} = \mathbf{I}. Matice, která má inverzi, je regulární matice, někdy též invertibilní matice. Pokud inverzní matici nemá, nazývá se singulární matice.
Součin matic \boldsymbol{AB} je regulární, právě když je každý z činitelů \boldsymbol A i \boldsymbol B regulární. V tomto případě platí
:(\boldsymbol{AB})^{-1} = \boldsymbol{B}^{-1}\boldsymbol{A}^{-1}.
Determinant součinu
Determinant součinu čtvercových matic je součin jejich determinantů. :\det (\boldsymbol{AB})=\det (\boldsymbol{BA})=\det \boldsymbol{A}\,\det \boldsymbol{B}.
Tento vztah platí kdykoli je R komutativní okruh, jmenovitě i v tělesech.
Výpočetní složitost
Výpočetní složitost výše popsaného algoritmu je O(n^3) (počítáme n^2 čísel; pro každé potřebujeme 2n-1 aritmetických operací). Existují však algoritmy s nižší složitostí vhodné pro matice vyšších řádů. +more Nejpoužívanější z nich je Strassenův algoritmus se složitostí O( n^{\log_2{7}}) \approx O(n^{2. 807}). Nižší složitost u tohoto algoritmu však získáváme za cenu snížené numerické stability. Asymptoticky nejrychlejší ze známých algoritmů je Coppersmithův-Winogradův algoritmus (O( n^{2. 376} )), který je však použitelný až pro matice tak velkých řádů, že je nelze zpracovávat pomocí současných počítačůRobinson, Sara (2005), "[url=http://www. siam. org/pdf/news/174. pdf]Toward an Optimal Algorithm for Matrix Multiplication[/url] ", SIAM News 38 (9), http://www. siam. org/pdf/news/174. pdf .
Teoreticky by se dala složitost ještě snížit, ale nikdy nemůže být menší než O( n^2 ), protože je třeba spočítat n^2 čísel.
Hledání nejkratší cesty v grafu
Algoritmy pro násobení matic s malou výpočetní složitostí lze využít i pro hledání nejkratší cesty v grafu z každého do každého vrcholu. To má v nejjednodušší podobě složitost O( n^3). +more V tomto případě se však nepoužívá zde popsané násobení matic, ale upravená verze, kde je místo sčítání výběr nejmenšího prvku a místo násobení sčítání, proto nelze použít například Strassenův algoritmus, který využívá operaci odčítání jako inverzní operaci ke sčítání, která k operaci \min není.
Graf lze popsat maticí vzdáleností \boldsymbol{A}. Pokud je pro výpočty operace sčítání dvou čísel definována jako jejich minimum, a místo násobení se použije sčítání, je možno matici nejkratších cest \boldsymbol{B} získat jako (\boldsymbol A^n) kde n je řád matice vzdáleností. +more Při reálném výpočtu není třeba cyklicky násobit původní maticí, ale vždy se vynásobí vzniklé výsledky - nejkratší cesty jsou získány po \log_2(n) násobeních. Je-li použit pro násobení algoritmus se složitostí menší než O\biggl(\frac{n^3}{\log_2(n)}\biggr), složitost hledání cest se tímto postupem sníží.
Odkazy
Reference
Literatura
Související články
Hadamardův součin * Skalární součin, Vnitřní součin * Smíšený součin * Strassenův algoritmus * Tenzorový součin, Vnější součin * Vektorový součin, Dvojitý vektorový součin
Externí odkazy
[url=http://www.umat.feec.vutbr.cz/~novakm/algebra_matic/cz]Lineární algebra: algebra matic[/url] Aplikace, která násobí a sčítá matice zadané uživatelem a zobrazuje postup výpočtu.