, 8 min read

Hermitesche, unitäre und normale Matrizen

Original post is here eklausmeier.goip.de/blog/2024/02-03-hermitesche-unitaere-und-normale-matrizen.


Hermitesche Matrizen (A=A), unitäre Matrizen (A=A1) und normale Matrizen (AA=AA) lassen sich unitär diagonalisieren. Dies ist das zentrale Ergebnis dieses Abschnittes.

Während die Jordansche Normalform für jede komplexe Matrix eine Fast-Diagonalgestalt ermöglicht [genauer (0,1)-Bandmatrixform mit Eigenwerten als Diagonalelementen], so erlaubt das nachfolgende Lemma von Schur eine Triagonalgestalt, allerdings auf vollständig unitärer Basis. Genau wie die Jordansche Normalform, gilt die Schursche Normalform nicht für reelle Matrizen in reeller Form, falls das charakteristische Polynom über R nicht zerfällt. Es entstehen dann (2×2) reelle Blöcke. Doch spielen hier und im weiteren reelle Matrizen keine bedeutende Rolle.

1. Satz: Satz über eine Schursche Normalform, Schur, Issai (10.01.1875--10.01.1941). ACn×n: U unitär:

UAU=(λ1λ20λn),

mit λi Eigenwerte von A.

Beweis: Sei λ1 Eigenwert von A und x1 normierter zugehöriger Eigenvektor x1x1=1. Es existieren linear unabhängige, paarweise unitäre (orthogonale) y2,,ynCn, sodaß X1:=(x1,y2,,yn) unitär ist (Basisergänzungssatz, Schmidtsches Orthogonalisierungsverfahren). Schmidt, Erhard (1876--1959). Also X1X1=I, somit x1yi=0 (i=2,,n), daher

X1AX1=(x1y2yn)(Ax1,Ay2,,Ayn)=(λ10A10).

A1C(n1)×(n1) enthält außer λ1, aufgrund der Ähnlichkeitstransformation, genau die gleichen Eigenwerte wie A. Man verfährt jetzt erneut wie oben: Zum Eigenwert λ2 von A1 (und auch A) gehört ein normierter Eigenvektor x2, Ax2=λ2x2, mit x2x2=1. Man ergänzt wieder zu einem paarweise orthogonalen Vektorsystem x2,z3,,znCn1, entsprechend

X2:=(10000x2z3zn)Cn×n

und somit

X2X1AX1X2=(λ10λ200A300).

Da unitäre Matrizen eine multiplikative, nicht-abelsche Gruppe (sogar kompakte Gruppe) bilden, insbesondere abgeschlossen sind, folgt nach nochmaliger (n2)-facher Wiederholung die behauptete Darstellung.     ☐

Aus dem Lemma von Schur folgt übrigens sofort der Dimensionssatz

A:CmCn,m=dimkerA+dimImA,

wenn man bei nicht quadratischen Matrizen, A zu einer quadratischen Matrix aus C(mn)×(mn) durch Nullauffüllung ergänzt.

2. A heißt normal, falls AA=AA, also A und A kommutieren. Beispielsweise sind hermitesche, schiefhermitesche und (komplexe) Vielfache unitärer Matrizen normal

A=A1AA=I=AA.

“Kleine” und spezielle normale Matrizen lassen sich leicht klassifizieren, wie man durch elementare Rechnung leicht nachweist.

3. Lemma: (1) Normale (2×2) Matrizen sind entweder hermitesch oder komplexe Vielfache unitärer Matrizen.

(2) Eine Dreiecksmatrix ist genau dann normal, wenn sie eine Diagonalmatrix ist.

Die Art einer Diagonalisierbarkeit bestimmt eindeutig Normalität, Hermitizität und Unitärheit.

4. Satz: (1) A normal A unitär diagonalisierbar.

(2) A hermitesch A unitär reell-diagonalisierbar.

(3) A schiefhermitesch A unitär imaginär-diagonalisierbar.

(4) A unitär A unitär unimodular-diagonalisierbar.

Beweis: zu (1): “”: Anwendung des vorstehenden Lemmas auf eine Schursche Normalform von A.

”: Mit A=UDU, Diagonalmatrix D und unitärem U (UU=I) rechnet man

AA=U(DU)UDU=UDDU,AA=UDUU(DU)=UDDU.

zu (2): “”: A=A xAx=λx,x=xAx=(Ax)x=λx,x, also λ=λ.

”: Axi=λxi=λxi=Axi i, also stimmen A und A auf einer Eigenbasis x1,,xn überein, also A=A in jeder Basis.

zu (3): “”: A=A, also AA=A2=AA, daher A normal. xAx=λxx=xAx=λxx, somit λ=λ, folglich λiP.

”: Mit A=UDU und Diagonalmatrix D=D ist A=UDU=UDU=A.

zu (4): “”: Wegen AA=I ist A invertierbar. Für ein Eigenelement (λ,x) zu A, also Ax=λx, ergibt sich Ax=λx=A1x=1λx, somit λλ=1=|λ|, für unitäre Matrizen A sind sämtliche Eigenwerte daher unimodular.

”: Eine unimodulare Diagonalmatrix ist unitär. Unitäre Matrizen bilden eine (nicht-abelsche) Gruppe.     ☐

Wegen AX=XD ist X die Matrix der Rechtseigenvektoren und X1 wegen X1A=DX1 die Matrix der Linkseigenvektoren. Eine Umformulierung von (1) des Satzes ist: Das Minimalpolynom einer Matrix besteht genau dann nur aus einfachen Nullstellen, wenn die Matrix normal ist. Natürlich gilt nicht notwendig, daß diagonalähnliche Matrizen hermitesch, unitär oder normal sind, wie B=(1203) zeigt (BBBB). Ist A hermitesch, so ist AA=A2 positiv semidefinit und positiv definit genau dann, wenn A invertierbar ist, da alle Eigenwerte von A2 nichtnegativ (bzw. positiv) sind. Der Rang einer schiefsymmetrischen Matrix ist wegen |A|=(1)n|A|, immer gerade. Dies hätte man auch mit Hilfe von (3) erkennen können, da die Determinante einer Diagonalmatrix das Produkt der Diagonalelemente ist.

Während die Schursche Normalform eine beliebige Matrix unitär zu triangulieren vermochte, so kann man sogar jede beliebige Matrix A “unitär-diagonalisieren”, wenn man darauf verzichtet auf beiden Seiten der Matrix A die gleiche unitäre Matrix U bzw. U zu verlangen.

5. Proposition: ACn×n: U,V unitär: A=UDV, mit D=diagλi, mit λi Eigenwerte von AA.

Beweis: Die Matrix AA ist hermitesch, also AA=WD^W, mit unitärem W und reeller Diagonalmatrix D^=diagλi. Es ist

λi=eiD^ei=eiWAAWei=AWei22>0.

Setze D=diagλi. Dann ist D1WAAWD1=I, also U:=AWD1 unitär. V:=W1 ist ebenfalls unitär und es gilt UDV=AWD1DW1=A.     ☐

Zur Notation siehe Das äußere Produkt und Determinanten.

Für positiv definite (hermitesche) Matrizen erkennt man auch gleich die Existenz einer beliebigen Wurzel, also Ar. Insbesondere für eine reelle symmetrische Matrix A mit lauter nicht-negativen Eigenwerten ( positiv semidefinit) gilt: Q: QQ=A. Ist A nicht quadratisch, so kann man durch Ergänzen von Nullspalten oder Nullzeilen quadratische Form erreichen und man erhält

6. Satz: Singulärwertzerlegung. ACm×n: UCm×m unitär, VCn×n unitär: A=UDV, mit DCm×n: D=row(diagλi,0)D=col(diagλi,0), mit λi Eigenwerte von AA.

Die Quadratwurzeln der Eigenwerte von AA heißen singuläre Werte, die Zerlegung A=UDV (w.o.) eine Singulärwertzerlegung. An ihr liest man die Pseudoinverse unmittelbar ab: A+=UD+V, wobei D+ aus D entsteht, indem man alle Nichtnull-Werte invertiert und die Nullen belässt.

7. Satz: Hurwitz-Kriterium, Adolf Hurwitz (1859--1919). Voraussetzungen: A sei hermitesch und A0, A0, A0, A0 kennzeichne positive, positive Semi-, negative, negative Semidefinitheit. r laufe stets von 1 bis n und der Multiindex i=(i1,,ir) sei stets in natürlicher Reihenfolge angeordnet, also i1<<ir. Genauso die Multiindizes k und .

Behauptung:

A0A1r1r>0Arnrn>0Ai1i1i2i2irir>0,A0Ai1i1i2i2irir0,A0(1)rA1r1r>0(1)nrArnrn>0(1)rAi1i1i2i2irir>0,A0(1)rAi1i1i2i2irir0.

Beweis: Sei A=XDX1 mit othogonalem X, also X1=X, und D sei die Diagonalmatrix der Eigenwerte. Es ist

1=(XX1)ii=Xi(X1)i=(Xi)2,

also können nicht sämtliche Xi verschwinden. Aus A=XDX1=X(XD) folgt

Aii=Xi(XD)i=k,XiXikDk=(Xi)2D,

da Dk=0, für k. An dieser Darstellung von Aii als Summe von Quadraten liest man nun alles ab. Für den Fall einer hermiteschen Matrix führt man die Überlegungen genauso mit unitärem X (X=X1) unter Beachtung von detC=detC.     ☐

8. Bemerkung: Kann man eine Matrix nicht unitär diagonalisieren oder treten nicht-lineare Elementarteiler auf, so hat man nicht mehr die Darstellung als Summe von Quadraten (Summe von Beträgen) und man kann dann nicht mehr so einfach entscheiden, ob alle Eigenwerte positiv oder dergleichen sind. Beispielsweise für die Begleitmatrix zu (λ1)(λ2)(λ3)=λ36λ2+11λ6 verschwinden die ersten beiden Hauptminoren. Ist man nur an dem Vorzeichenverhalten einer Form xAx interessiert, so kann man das Hurwitz-Kriterium anwenden auf die hermitesche Matrix 12(A+A).

Es gilt zwar A0A1r1r0aii0, jedoch die Rückrichtung stimmt nicht, wie man erkennt anhand der Matrix

A=(0001000000001000),

mit Eigenwerten 0 (zweifach), (+1) und (1).