ART

Στη γραμμική άλγεβρα, το θεώρημα Κέιλεϊ – Χάμιλτον (πήρε το όνομά του από τους μαθηματικούς Άρθουρ Κέιλεϊ και Γουίλιαμ Ρόουαν Χάμιλτον) αναφέρει ότι κάθε τετραγωνικός πίνακας πάνω από έναν αντιμεταθετικό δακτύλιο (όπως είναι τα σώματα των πραγματικών ή των μιγαδικών) ικανοποιεί τη δική του χαρακτηριστική εξίσωση.

Αν Α είναι δοθείς n × n {\displaystyle n\times n} n\times n πίνακας και \( {\displaystyle I_{n}} \) είναι \( n\times n \) ταυτοτικός πίνακας, τότε το χαρακτηριστικό πολυώνυμο του A ορίζεται ως[4]

\( {\displaystyle p(\lambda )=\det(\lambda I_{n}-A)~,} \)

όπου d e t {\displaystyle det} {\displaystyle det} είναι η ορίζουσα και x {\displaystyle x} x; είναι το βαθμωτό στοιχείο της βάσης δακτυλίου. Δεδομένου ότι οι καταχωρήσεις του πίνακα είναι (γραμμικά ή σταθερά) πολυώνυμα στο λ, η ορίζουσα είναι επίσης μια n-οστής τάξης κανονικού πολυωνύμου στο λ. Το θεώρημα Cayley–Hamilton δηλώνει ότι αντικαθιστώντας στον πίνακα A για λ σε αυτό το πολυώνυμο έχει ως αποτέλεσμα τον μηδενικό πίνακα,

\( {\displaystyle p(A)=0.} \)

Οι δυνάμεις του Α, που λαμβάνονται από την αντικατάσταση των δυνάμεων του λ, καθορίζονται από τον επαναλαμβανόμενο πολλαπλασιασμό πινάκων: ο σταθερός όρος του \( {\displaystyle p(\lambda )} \) δίνει ένα πολλαπλάσιο της δύναμης Α0, του οποίου η δύναμη ορίζεται ως ο ταυτοτικός πίνακας . Το θεώρημα επιτρέπει το Αn να εκφραστεί ως γραμμικός συνδυασμός των χαμηλότερων δυνάμεων του πίνακα Α. Όταν ο δακτύλιος είναι ένα σώμα, το θεώρημα Κέιλεϊ-Χάμιλτον είναι ισοδύναμο με τη δήλωση ότι το ελάχιστο πολυώνυμο ενός τετραγωνικού πίνακα διαιρεί το χαρακτηριστικό πολυώνυμο.

Το θεώρημα αποδείχτηκε για πρώτη φορά το 1853[5] αναφορικά με τους αντίστροφους όρους των γραμμικών συναρτήσεων των τετραδικών αριθμών, ένας μη-αντιμεταθετικός δακτύλιος, από τον Hamilton.[6][7][8] Αυτό αντιστοιχεί στην ειδική περίπτωση ορισμένων πραγματικών \( {\displaystyle 4\times 4} \) πραγματικών ή \( {\displaystyle 2\times 2} \) μιγαδικών πινάκων. Το θεώρημα ισχύει γενικά για τετραδικούς πίνακες.[9][nb 1] Ο Cayley το 1858 το δήλωσε για \( {\displaystyle 3\times 3} \) και μικρότερους πίνακες, αλλά δημοσίευσε μια απόδειξη μόνο για τη \( {\displaystyle 2\times 2} \) περίπτωση.[2] Η γενική περίπτωση αποδείχτηκε για πρώτη φορά από τον Frobenius το 1878.[10]

Παραδείγματα
\( {\displaystyle 1\times 1} πίνακες \)

Για έναν \( {\displaystyle 1\times 1} \) πίνακα \( {\displaystyle A=(\alpha _{1,1})} \), το χαρακτηριστικό πολυώνυμο δίνεται από την \( {\displaystyle p(\lambda )=\lambda -\alpha } \), οπότε \( {\displaystyle p(A)=\alpha -\alpha _{1,1}=0} \) είναι προφανές.
2 × 2 {\displaystyle 2\times 2} {\displaystyle 2\times 2} πίνακες

Ως συγκεκριμένο παράδειγμα, ας πάρουμε

\( {\displaystyle A={\begin{pmatrix}1&2\\3&4\end{pmatrix}}}. \)

Το χαρακτηριστικό πολυώνυμο δίνεται από

\( {\displaystyle p(\lambda )=\det(\lambda I_{2}-A)=\det {\begin{pmatrix}\lambda -1&-2\\-3&\lambda -4\end{pmatrix}}=(\lambda -1)(\lambda -4)-(-2)(-3)=\lambda ^{2}-5\lambda -2.} \)

Το θεώρημα Cayley–Hamilton ισχυρίζεται ότι, αν ορίσουμε

\( {\displaystyle p(X)=X^{2}-5X-2I_{2},} \)

στη συνέχεια

\( {\displaystyle p(A)=A^{2}-5A-2I_{2}={\begin{pmatrix}0&0\\0&0\\\end{pmatrix}}.} \)

Μπορούμε να το επιβεβαιώσουμε από υπολογισμό, ότι πράγματι,

\( {\displaystyle A^{2}-5A-2I_{2}={\begin{pmatrix}7&10\\15&22\\\end{pmatrix}}-{\begin{pmatrix}5&10\\15&20\\\end{pmatrix}}-{\begin{pmatrix}2&0\\0&2\\\end{pmatrix}}={\begin{pmatrix}0&0\\0&0\\\end{pmatrix}}.} \)

Για ένα γενικά 2 × 2 {\displaystyle 2\times 2} {\displaystyle 2\times 2} πίνακα,

\( {\displaystyle A={\begin{pmatrix}a&b\\c&d\\\end{pmatrix}},} \)

το χαρακτηριστικό πολυώνυμο που δίνεται από το \( {\displaystyle p(\lambda )=\lambda ^{2}-(a+d)\lambda +(ad-bc)} \), οπότε το θεώρημα Cayley–Hamilton δηλώνει ότι

\( {\displaystyle p(A)=A^{2}-(a+d)A+(ad-bc)I_{2}={\begin{pmatrix}0&0\\0&0\\\end{pmatrix}};} \)

το οποίο πράγματι είναι πάντα η περίπτωση, εμφανής δουλεύοντας τις καταχωρήσεις του Α2.

Εφαρμογές
Ορίζουσα και αντίστροφος πίνακας
William Rowan Hamilton (1805-1865), Ιρλανδός φυσικός, αστρονόμος και μαθηματικός, το πρώτο ξένο μέλος της Αμερικανικής Εθνικής Ακαδημίας Επιστημών. Διατηρώντας την αντίθετη θέση για το πώς η γεωμετρία θα πρέπει να μελετηθεί,ο Χάμιλτον διατήρησε καλές σχέσεις με τον Cayley.[1]

Ο Χάμιλτον απέδειξε ότι για μια γραμμική συνάρτηση των τετραδικών αριθμών υπάρχει μια συγκεκριμένη εξίσωση, ανάλογα με τη γραμμική συνάρτηση, που ικανοποιείται μόνη της από την γραμμική συνάρτηση .[6][7][8]

Για έναν γενικά \( n\times n \) αντιστρέψιμο πίνακα Α, δηλαδή, ένας με μη μηδενική ορίζουσα, Α-1  μπορεί να γραφτεί ως \( {\displaystyle (n-1)}\)-οστής τάξης πολυωνυμική έκφραση στον Α: Όπως αναφέρεται, το θεώρημα Cayley–Hamτην ilton ανέρχεται στην ταυτότητα.

\( {\displaystyle p(A)=A^{n}+c_{n-1}A^{n-1}+...+c_{1}A+(-1)^{n}det(A)I_{n}} \)

Οι συντελεστές θα δίνονται από τα στοιχειώδη συμμετρικά πολυώνυμα των ιδιοτιμών του A. Χρησιμοποιώντας τις ταυτότητες Νewton, τα στοιχειώδη συμμετρικά πολυώνυμα μπορούν με τη σειρά τους να εκφράζονται αναφορικά με τα αθροίσματα δυνάμεων συμμετρικών πολυωνύμων των ιδιοτιμών:

\( {\displaystyle s_{k}=\sum _{i=1}^{n}\lambda _{i}^{k}=\mathrm {tr} (A^{k}),} \)

όπου tr (Ak) είναι το ίχνος  του πίνακα Ak. Έτσι, μπορούμε να εκφράσουμε το όσον αφορά το ίχνος των δυνάμεων του Α.

Σε γενικές γραμμές, ο τύπος για τους συντελεστές \( {\displaystyle c_{i}} \) θα δοθεί αναφορικά με την πλήρες εκθετική έκφραση των Bell πολυωνύμων ως [nb 2]

\( {\displaystyle c_{n-k}={\frac {(-1)^{k}}{k!}}B_{k}(s_{1},-1!s_{2},2!s_{3},\ldots ,(-1)^{k-1}(k-1)!s_{k}).} \)

Ειδικότερα, η ορίζουσα του Α αντιστοιχεί στο c0. Έτσι, η ορίζουσα μπορεί να γραφτεί ως ένα ίχνος ταυτότητας

\( {\displaystyle \det(A)={\frac {1}{n!}}B_{n}(s_{1},-1!s_{2},2!s_{3},\ldots ,(-1)^{n-1}(n-1)!s_{n}).} \)

Επίσης, το χαρακτηριστικό πολυώνυμο μπορεί να γραφτεί ως

\( {\displaystyle -(-1)^{n}\det(A)I_{n}=A(A^{n-1}+c_{n-1}A^{n-2}+\cdots +c_{1}I_{n}),} \)

και, πολλαπλασιάζοντας και τις δύο πλευρές με το A−1 (σημείωση −(-1)n = (-1)n-1), οδηγείται σε μια έκφραση για το αντίστροφο του A ως ίχνος της ταυτότητας,

\( {\displaystyle {\begin{aligned}A^{-1}&={\frac {(-1)^{n-1}}{\det A}}(A^{n-1}+c_{n-1}A^{n-2}+\cdots +c_{1}I_{n}),\\&={\frac {1}{\det A}}\sum _{k=0}^{n-1}(-1)^{n+k-1}{\frac {A^{n-k-1}}{k!}}B_{k}(s_{1},-1!s_{2},2!s_{3},\ldots ,(-1)^{k-1}(k-1)!s_{k}).\end{aligned}}} \)

Για παράδειγμα, τα πρώτα Bell πολυώνυμα είναι Β0 = 1, B1(x1) = x1, B2(x1, x2) = x12 + x2και Β3(x1, x2, x3) = x13 + 3 x1x2 + x3.

Χρησιμοποιώντας αυτές για να καθορίσετε τους συντελεστές  ci για το χαρακτηριστικό πολυώνυμο ενός 2×2 πίνακα απόδοσης

\( {\displaystyle c_{2}=B_{0}=1,} \)
\( {\displaystyle c_{1}={\frac {-1}{1!}}B_{1}(s_{1})=-s_{1}=-\mathrm {tr} (A),} \)
\( {\displaystyle c_{0}={\frac {1}{2!}}B_{2}(s_{1},-1!s_{2})={\frac {1}{2}}(s_{1}^{2}-s_{2})={\frac {1}{2}}((\mathrm {tr} (A))^{2}-\mathrm {tr} (A^{2})).} \)

Ο συντελεστής c0 δίνει την ορίζουσα του 2×2 πίνακα, c1 μείον το ίχνος της, ενώ το αντίστροφο δίνεται από

\( {\displaystyle A^{-1}={\frac {-1}{\det A}}(A+c_{1}I_{2})={\frac {-2(A-\mathrm {tr} (A)I_{2})}{(\mathrm {tr} (A))^{2}-\mathrm {tr} (A^{2})}}.} \)

Είναι προφανές από το γενικό τύπο για το cn-k, εκφρασμένο σε Bell πολυώνυμα, ότι αυτή η έκφραση, ½ ((trΑ)2 − tr(A2)), δίνει πάντα το συντελεστή cn-2 του λn-2 στο χαρακτηριστικό πολυώνυμο κάθε n×n πίνακα: για ένα 3×3 πίνακα Α, η δήλωση από το θεώρημα Cayley–Hamilton μπορεί επίσης να γραφτεί ως

\( {\displaystyle A^{3}-(\operatorname {tr} A)A^{2}+{\frac {1}{2}}\left((\operatorname {tr} A)^{2}-\operatorname {tr} (A^{2})\right)A-\det(A)I_{3}=0,} \)

όπου η δεξιά πλευρά ορίζει ένα 3×3 πίνακα με όλες τις καταχωρήσεις μειωμένες στο μηδέν. Επίσης,η ορίζουσα για την n = 3 περίπτωση, είναι τώρα

\( {\displaystyle {\begin{aligned}\det(A)&={\frac {1}{3!}}B_{3}(s_{1},-1!s_{2},2!s_{3})={\frac {1}{6}}(s_{1}^{3}+3s_{1}(-s_{2})+2s_{3})\\&={\tfrac {1}{6}}\left((\operatorname {tr} A)^{3}-3\operatorname {tr} (A^{2})(\operatorname {tr} A)+2\operatorname {tr} (A^{3})\right).\end{aligned}}} \)

Αυτή η έκφραση δίνει την άρνηση του συντελεστή cn-3 του λn-3 στη γενική περίπτωση, όπως φαίνεται παρακάτω.

Ομοίως, μπορεί κανείς να γράψει για έναν 4×4 πίνακα Α,

\( {\displaystyle A^{4}-(\operatorname {tr} A)A^{3}+{\tfrac {1}{2}}{\bigl (}(\operatorname {tr} A)^{2}-\operatorname {tr} (A^{2}){\bigr )}A^{2}-{\tfrac {1}{6}}{\bigl (}(\operatorname {tr} A)^{3}-3\operatorname {tr} (A^{2})(\operatorname {tr} A)+2\operatorname {tr} (A^{3}){\bigr )}A+\det(A)I_{4}=0,} \)

όπου, τώρα, η ορίζουσα είναι cn-4,

\( {\displaystyle {\tfrac {1}{24}}\left((\operatorname {tr} A)^{4}-6\operatorname {tr} (A^{2})(\operatorname {tr} A)^{2}+3(\operatorname {tr} (A^{2}))^{2}+8\operatorname {tr} (A^{3})\operatorname {tr} (A)-6\operatorname {tr} (A^{4})\right),} \)

και ούτω καθεξής για μεγαλύτερους πίνακες. Οι ολοένα και πιο πολύπλοκες εκφράσεις για τους συντελεστές ck συνάγονται από τις ταυτότητες του Νεύτονα ή τον Faddeev-LeVerrier αλγόριθμο.

Μια άλλη μέθοδος για την απόκτηση αυτών των συντελεστών ck για γενικά έναν n×n πίνακα, εφόσον δεν έχει ρίζα το μηδέν, βασίζεται στην ακόλουθη εναλλακτική έκφραση για την ορίζουσα,

\( {\displaystyle p(\lambda )=\det(\lambda I_{n}-A)=\lambda ^{n}\exp(\operatorname {tr} (\log(I_{n}-A/\lambda ))).} \)

Ως εκ τούτου, δυνάμει των σειρών Mercator,

\( {\displaystyle p(\lambda )=\lambda ^{n}\exp \left(-\operatorname {tr} \sum _{m=1}^{\infty }{({A \over \lambda })^{m} \over m}\right),} \)

όπου η εκθετική το μόνο που χρειάζεται είναι να επεκταθεί για να πάρετε το λ−n, δεδομένου ότι το p(λ) είναι της τάξης n, οι καθαρά αρνητικές δυνάμεις του λ αυτόματα εξαφανίζονται από το C–H θεώρημα. (Και πάλι, αυτό απαιτεί ένα δακτύλιο που περιέχει τους ρητούς αριθμούς.) Οι συντελεστές του λ, μπορούν να γραφούν απευθείας αναφορικά με τα Bell πολυώνυμα,συγκρίνοντας αυτή την έκφραση με την γενική συνάρτηση του Bell πολυωνύμου.

Διαφοροποίηση αυτής της έκφρασης με σεβασμό προς λ επιτρέπει την ορίζουσα των γενικών συντελεστών του χαρακτηριστικού πολυωνύμου για το γενικό n, όπως οι ορίζουσες των m×m πινάκων,[nb 3]

\( {\displaystyle c_{n-m}={\frac {(-1)^{m}}{m!}}{\begin{vmatrix}\operatorname {tr} A&m-1&0&\cdots \\\operatorname {tr} A^{2}&\operatorname {tr} A&m-2&\cdots \\\vdots &\vdots &&&\vdots \\\operatorname {tr} A^{m-1}&\operatorname {tr} A^{m-2}&\cdots &\cdots &1\\\operatorname {tr} A^{m}&\operatorname {tr} A^{m-1}&\cdots &\cdots &\operatorname {tr} A\end{vmatrix}}~.} \)

n-οστή Δύναμη του πίνακα

Το θεώρημα Cayley–Hamilton παρέχει πάντα μια σχέση μεταξύ των δυνάμεων του Α (αν και δεν είναι πάντα η πιο απλή), η οποία επιτρέπει σε κάποιον να απλοποιήσει τις εκφράσεις που αφορούν τις εν λόγω δυνάμεις, και να τις αξιολογήσει χωρίς να χρειάζεται να υπολογίσει τη δύναμη An ή τυχόν ανώτερες δυνάμεις του Α.

Λόγω χάρη, το συγκεκριμένο 2×2 παραπάνω παράδειγμα μπορεί να γραφτεί ως

\( {\displaystyle A^{2}=5A+2I_{2}\,.} \)

Στη συνέχεια, για παράδειγμα, για να υπολογίσετε το A 4 {\displaystyle A^{4}} {\displaystyle A^{4}} ,παρατηρούμε

\( {\displaystyle A^{3}=(5A+2I_{2})A=5A^{2}+2A=5(5A+2I_{2})+2A=27A+10I_{2}\,} \)
\( {\displaystyle A^{4}=A^{3}A=(27A+10I_{2})A=27A^{2}+10A=27(5A+2I_{2})+10A=145A+54I_{2}\,.} \)

Ομοίως,
\( {\displaystyle A^{-1}={\frac {A-5I_{2}}{2}}~.} \)

Πίνακες συναρτήσεων

Δίνεται μια αναλυτική συνάρτηση

\( {\displaystyle f(x)=\sum _{k=0}^{\infty }a_{k}x^{k}} \)

και το χαρακτηριστικό πολυώνυμο p(x) βαθμού n του n × n πίνακα Α, η συνάρτηση μπορεί να εκφραστεί χρησιμοποιώντας τη διαίρεση ως

\( {\displaystyle f(x)=q(x)p(x)+r(x),} \)

όπου q(x) είναι το πηλίκο πολυώνυμο και το r(x) είναι το υπόλοιπο πολυώνυμο τέτοια ώστε 0 ≤ deg r(x) < n. Από το θεώρημα Cayley-Hamilton,αντικαθιστώντας το x από τον πίνακα Α δίνει p(A) = 0, οπότε έχει

\( {\displaystyle f(A)=r(A).} \)

Έτσι, η αναλυτική συνάρτηση του πίνακα A μπορεί να εκφραστεί ως πίνακας πολυώνυμων βαθμού μικρότερο από n.

Το υπόλοιπο πολυώνυμο ας είναι

\( {\displaystyle r(x)=c_{0}+c_{1}x+\cdots +c_{n-1}x^{n-1}.} \)

Δεδομένου ότι το p(λ) = 0, κατά την αξιολόγηση της συνάρτησης f(x) για τις n ιδιοτιμές του A,δίνουν

\( {\displaystyle f(\lambda _{i})=r(\lambda _{i})=c_{0}+c_{1}\lambda _{i}+\cdots +c_{n-1}\lambda _{i}^{n-1},\qquad \mathrm {for} \qquad i=1,2,...,n.} \)

Αυτό ισοδυναμεί με ένα σύστημα n γραμμικών εξισώσεων, το οποίο μπορεί να λυθεί για τον προσδιορισμό των συντελεστών ci. Έτσι, το ένα έχει

\( {\displaystyle f(A)=\sum _{k=0}^{n-1}c_{k}A^{k}.} \)

Όταν οι ιδιοτιμές είναι επαναλαμβανόμενες, λi = λj για κάποιο i ≠ j, δύο ή περισσότερες εξισώσεις είναι ίδιες, και ως εκ τούτου οι γραμμικές εξισώσεις δεν μπορούν να λυθούν μεμονωμένα. Σε τέτοιες περιπτώσεις, για μια ιδιοτιμή λ, με πολλαπλότητα m, η πρώτη m – 1 παράγωγος της p(x) εξαφανίζεται στις ιδιοτιμές. Έτσι, υπάρχουν οι επιπλέον m – 1 γραμμικά ανεξάρτητες λύσεις

\( {\displaystyle {\frac {\mathrm {d} ^{k}f(x)}{\mathrm {d} x^{k}}}{\Big |}_{x=\lambda }={\frac {\mathrm {d} ^{k}r(x)}{\mathrm {d} x^{k}}}{\Big |}_{x=\lambda }\qquad \mathrm {for} \qquad k=1,2,\ldots ,m-1,} \)

οι οποίες, όταν συνδυάζονται με άλλους, δίνουν τις απαιτούμενες n εξισώσεις για την επίλυση του ci.

Η εύρεση ενός πολυωνύμου που περνάει από τα σημεία (λi, f (λi)) είναι ουσιαστικά ένα πρόβλημα παρεμβολής, και μπορεί να λυθεί χρησιμοποιώντας τις τεχνικές παρεμβολής Lagrange ή Newton , που οδηγούν στον τύπο Sylvester .

Για παράδειγμα, ας υποθέσουμε ότι ο στόχος είναι να βρεθείθεί το αντιπροσωπευτικό πολυώνυμο του

\( {\displaystyle f(A)=e^{At}\qquad \mathrm {where} \qquad A={\begin{pmatrix}1&2\\0&3\end{pmatrix}}.} \)

Το χαρακτηριστικό πολυώνυμο είναι p(x) = (x - 1)(x - 3) = x2 - 4 x + 3, και οι ιδιοτιμές είναι λ = 1, 3. Ας είναι r(x) = c0 + c1x. Υπολογίζοντας το  f(λ) = r(λ) για τις  ιδιοτιμές, η μια περιέχει δύο γραμμικές εξισώσεις et = c0 + c1 και e3t = c0 + 3 c1.  . Η επίλυση των εξισώσεων δίνει c0 = (3 et - e3t)/2 και c1 = (e3t - et)/2. Συνεπώς, προκύπτει ότι

\( {\displaystyle e^{At}=c_{0}I_{2}+c_{1}A={\begin{pmatrix}c_{0}+c_{1}&2c_{1}\\0&c_{0}+3c_{1}\end{pmatrix}}={\begin{pmatrix}e^{t}&e^{3t}-e^{t}\\0&e^{3t}\end{pmatrix}}.} \)

Αν, αντίθετα, η συνάρτηση ήταν f(A) = sin At τότε οι συντελεστές θα ήταν c0 = (3 sin t - sin 3t)/2 και c1 = (sin 3t - sin t)/2 :ως εκ τούτου,

\( {\displaystyle \sin(At)=c_{0}I_{2}+c_{1}A={\begin{pmatrix}\sin t&\sin 3t-\sin t\\0&\sin 3t\end{pmatrix}}.} \)

Ως ένα ακόμη παράδειγμα, κατά την εξέταση

\( {\displaystyle f(A)=e^{At}\qquad \mathrm {where} \qquad A={\begin{pmatrix}0&1\\-1&0\end{pmatrix}},} \)

τότε το χαρακτηριστικό πολυώνυμο είναι p(x) = x2 + 1, και οι ιδιοτιμές είναι λ = i, -i. Όπως και πριν, ο υπολογισμός της συνάρτησης για τις  ιδιοτιμές μας δίνει τις γραμμικές εξισώσεις eit = c0 + i c1 και e-it = c0 - i c1 η λύση του οποίου δίνει, c0 = (e ' + e-)/2 = cos t και c1 = (e ' - e-)/2i = sin t. Έτσι, για την περίπτωση αυτή,

\( {\displaystyle e^{At}=(\cos t)I_{2}+(\sin t)A={\begin{pmatrix}\cos t&\sin t\\-\sin t&\cos t\end{pmatrix}},} \)

η οποία είναι ένας αντίστροφος πίνακας.

Πρότυπα παραδείγματα τέτοιας χρήσης είναι η εκθετική απεικόνιση από την Άλγεβρα Lie των πινάκων της ομάδας Lie σε ομάδα. Δίνεται από έναν εκθετικό πίνακα,

\( {\displaystyle \exp :{\mathfrak {g}}\rightarrow G;tX\mapsto e^{tX}=\sum _{n=0}^{\infty }{\frac {t^{n}X^{n}}{n!}}=I+tX+{\frac {t^{2}X^{2}}{2}}+\cdots ,t\in \mathbb {R} ,X\in {\mathfrak {g}}.} \)

Τέτοιες εκφράσεις είναι γνωστό από καιρό για την SU(2),

\( {\displaystyle e^{i(\theta /2)({\hat {n}}\cdot \sigma )}=I_{2}\cos \theta /2+i({\hat {n}}\cdot \sigma )\sin \theta /2,} \)

όπου το σ είναι οι πίνακες Pauli και για το SO (3),

\( {\displaystyle e^{i\theta ({\hat {n}}\cdot \mathbf {J} )}=I_{3}+i({\hat {n}}\cdot \mathbf {J} )\sin \theta +({\hat {n}}\cdot \mathbf {J} )^{2}(\cos \theta -1),} \)

το οποίο είναι ο τύπος της περιστροφής του Rodrigues. Για το συμβολισμό, παρακαλούμε δείτε την ομάδα περιστροφής SO(3)#A σημείωση σχετικά με τις αναπαραστάσεις.

Πιο πρόσφατα, εκφράσεις έχουν εμφανιστεί για άλλες ομάδες, όπως η ομάδα Lorentz  SO(3, 1),[11] O(4, 2)[12] και SU(2, 2),[13] , καθώς και GL(n, R).[14] Η ομάδα O(4, 2) είναι  η σύμμορφος ομάδα του χωροχρόνου, SU(2, 2) η απλή συνδεδεμένη κάλυψή της (για να είμαι ακριβής,το απλό συνδεδεμένο κάλυμμα της συνεκτικής συνιστώσας SO+(4, 2) της O(4, 2)). Οι εκφράσεις που λαμβάνονται ισχύουν για την τυπική αναπαράσταση των ομάδων αυτών. Απαιτούν γνώση από (κάποιες από) τις ιδιοτιμές του πίνακα των εκθετών. Για το SU(2) (και ως εκ τούτου, για το SO(3)), κλειστές εκφράσεις έχουν πρόσφατα ληφθεί για όλες τις αμείωτες αναπαραστάσεις, δηλαδή για κάθε γύρισμα.[15]

Απόδειξη του θεωρήματος γενικά

Όπως τα παραπάνω παραδείγματα δείχνουν, η απόκτηση από το θεώρημα Cayley–Hamilton για ένα n×n πίνακα

\( {\displaystyle A=(a_{ij})_{i,j=1}^{n}} \)
)
απαιτεί δύο βήματα: πρώτα οι συντελεστές ci του χαρακτηριστικού πολυωνύμου καθορίζονται από την ανάπτυξη ως ένα πολυώνυμο t της ορίζουσας

\( {\displaystyle p(t)=\det(tI_{n}-A)={\begin{vmatrix}t-a_{1,1}&-a_{1,2}&\cdots &-a_{1,n}\\-a_{2,1}&t-a_{2,2}&\cdots &-a_{2,n}\\\vdots &\vdots &\ddots &\vdots \\-a_{n,1}&-a_{n,2}&\cdots &t-a_{n,n}\\\end{vmatrix}}=t^{n}+c_{n-1}t^{n-1}+\cdots +c_{1}t+c_{0},} \)

και τότε οι συντελεστές αυτοί χρησιμοποιούνται σε ένα γραμμικό συνδυασμό των αρμοδιοτήτων της A που είναι ίσο με το n×n μηδενικό πίνακα:

\( {\displaystyle A^{n}+c_{n-1}A^{n-1}+\cdots +c_{1}A+c_{0}I_{n}={\begin{pmatrix}0&\cdots &0\\\vdots &\ddots &\vdots \\0&\cdots &0\end{pmatrix}}.} \)

Η αριστερή πλευρά μπορεί να εργαστεί σε ένα n×n πίνακα του οποίου οι καταχωρήσεις είναι (τεράστιες) πολυωνυμικές εκφράσεις στο σύνολο καταχωρήσεων ai,j του A, οπότε το θεώρημα Cayley–Hamilton δηλώνει ότι κάθε ένα από τις n2 εκφράσεις είναι ίσες με 0. Για κάθε σταθερή τιμή της n οι ταυτότητες αυτές μπορούν να ληφθούν από κουραστικούς αλλά εντελώς απλούς αλγεβρικόυς χειρισμούς. Κανένας από αυτούς τους υπολογισμούς δε μπορεί να δείξει, ωστόσο, γιατί το θεώρημα Cayley–Hamilton θα πρέπει να ισχύει για τους πίνακες όλων των πιθανών μεγεθών n, έτσι μια ομοιόμορφη απόδειξη για όλα τα n είναι απαραίτητη η οποία είναι το μηδενικό διάνυσμα από το p(λ) = 0 (οι ιδιοτιμές του A είναι ακριβώς οι ρίζες του p(t). Αυτό ισχύει για όλες τις πιθανές ιδιοτιμές λ, έτσι ώστε οι δύο πίνακες εξισώνονται με το θεώρημα θα δώσουν σίγουρα το ίδιο (μηδενικό) αποτέλεσμα όταν εφαρμόζονται σε κάθε ιδιοκορφή. Τώρα, αν A παραδέχεται μια βάση των ιδιοδιανυσμάτων, με άλλα λόγια, αν A είναι διαγωνοποιήσιμος , τότε το θεώρημα Cayley–Hamilton θα πρέπει να περιμένετε για A, από δύο πίνακες που δίνουν τις ίδιες αξίες, όταν εφαρμόζεται σε κάθε στοιχείο της βάσης πρέπει να είναι ίσες. Δεν είναι όλοι οι πίνακες διαγωνοποιήσιμοι, αλλά για πίνακες με μιγαδικούς συντελεστές πολλοί από αυτούς είναι: το σύνολο των διαγωνοποιήσιμων συγκροτημάτων τετραγωνικών πινάκων του συγκεκριμένου μεγέθους είναι πυκνό στο σύνολο όλων αυτών των τετραγωνικών πινάκων[17] (για ένα πίνακα για να γίνει να διαγώνιος αρκεί, για παράδειγμα, ότι το χαρακτηριστικό πολυώνυμο δεν έχει πολλαπλές ρίζες). Τώρα, αν οποιαδήποτε από τις n2 εκφράσεις, ότι το θεώρημα ισοδυναμεί με 0 , δεν θα είναι μηδενική έκφραση, με άλλα λόγια, αν είναι ένα μη μηδενικό πολυώνυμο είναι οι συντελεστές του μηδενικού πίνακα, τότε το σύνολο των περίπλοκων πινάκων για τα οποία η έκφραση αυτή γίνεται για να δώσει 0 δεν είναι πυκνό στο σύνολο όλων των πινάκων, η οποία έρχεται σε αντίθεση με το γεγονός ότι το θεώρημα ισχύει για όλους τους διαγωνοποιήσιμους πίνακες. Έτσι, μπορεί κανείς να δει ότι το θεώρημα Cayley–Hamilton θα πρέπει να είναι αλήθεια.
Ενώ αυτό παρέχει μια έγκυρη απόδειξη (για πίνακες πάνω από τους μιγαδικούς αριθμούς), το επιχείρημα δεν είναι πολύ ικανοποιητικό, δεδομένου ότι οι ταυτότητες που αντιπροσωπεύεται από το θεώρημα σε καμία περίπτωση, δεν εξαρτώνται από τη φύση του πίνακα (διαγώνιος ή όχι), ούτε για το είδος των καταχωρήσεων επιτρέπεται (για πίνακες με πραγματική καταχωρήσεις οι διαγώνιοι αυτοί δεν σχηματίζουν ένα πυκνό σύνολο, και αν φαίνεται παράξενο, θα πρέπει να εξετάσετε μιγαδικούς πίνακες για να δείτε ότι το θεώρημα Cayley–Hamilton ισχύει και για αυτούς). Ως εκ τούτου, πρέπει τώρα να εξετάσετε μόνο τα επιχειρήματα που αποδεικνύουν το θεώρημα άμεσα για οποιαδήποτε πίνακα με τη χρήση αλγεβρικών χειρισμών, μόνο αυτά έχουν επίσης το πλεονέκτημα της εργασίας για πίνακες με καταχωρήσεις σε κάθε αντιμεταθετική δαχτυλίδι.
Υπάρχει μια μεγάλη ποικιλία από τέτοιες αποδείξεις από το θεώρημα Cayley–Hamilton, εκ των οποίων πολλές θα δοθούν εδώ. Διαφέρουν στο ποσό των αφηρημένων αλγεβρικών εννοιών που απαιτούνται για να κατανοήσουμε την απόδειξη. Η απλούστερες αποδείξεις χρησιμοποιούν μόνο εκείνες τις έννοιες που απαιτούνται για να διατυπώσουμε το θεώρημα (πίνακες, πολυώνυμα με αριθμητικές καταχωρήσεις, καθοριστικούς παράγοντες), αλλά περιλαμβάνει τεχνικές υπολογισμών που καθιστούν κάπως μυστηριώδη το γεγονός ότι μπορούν να οδηγήσουν ακριβώς στο σωστό συμπέρασμα. Είναι δυνατόν να αποφευχθούν τέτοιου είδους λεπτομέρειες, αλλά στην τιμή που περιλαμβάνει πιο λεπτές αλγεβρικές έννοιες: πολυωνύμων με συντελεστές σε ένα μη-αντιμεταθετική δαχτυλίδι, ή πίνακες με ασυνήθιστα είδη καταχωρίσεων.

η οποία είναι το μηδενικό διάνυσμα από το p(λ) = 0 (οι ιδιοτιμές του A είναι ακριβώς οι ρίζες του p(t). Αυτό ισχύει για όλες τις πιθανές ιδιοτιμές λ, έτσι ώστε οι δύο πίνακες εξισώνονται με το θεώρημα θα δώσουν σίγουρα το ίδιο (μηδενικό) αποτέλεσμα όταν εφαρμόζονται σε κάθε ιδιοκορφή. Τώρα, αν A παραδέχεται μια βάση των ιδιοδιανυσμάτων, με άλλα λόγια, αν A είναι διαγωνοποιήσιμος , τότε το θεώρημα Cayley–Hamilton θα πρέπει να περιμένετε για A, από δύο πίνακες που δίνουν τις ίδιες αξίες, όταν εφαρμόζεται σε κάθε στοιχείο της βάσης πρέπει να είναι ίσες. Δεν είναι όλοι οι πίνακες διαγωνοποιήσιμοι, αλλά για πίνακες με μιγαδικούς συντελεστές πολλοί από αυτούς είναι: το σύνολο των διαγωνοποιήσιμων συγκροτημάτων τετραγωνικών πινάκων του συγκεκριμένου μεγέθους είναι πυκνό στο σύνολο όλων αυτών των τετραγωνικών πινάκων[17] (για ένα πίνακα για να γίνει να διαγώνιος αρκεί, για παράδειγμα, ότι το χαρακτηριστικό πολυώνυμο δεν έχει πολλαπλές ρίζες). Τώρα, αν οποιαδήποτε από τις n2 εκφράσεις, ότι το θεώρημα ισοδυναμεί με 0 , δεν θα είναι μηδενική έκφραση, με άλλα λόγια, αν είναι ένα μη μηδενικό πολυώνυμο είναι οι συντελεστές του μηδενικού πίνακα, τότε το σύνολο των περίπλοκων πινάκων για τα οποία η έκφραση αυτή γίνεται για να δώσει 0 δεν είναι πυκνό στο σύνολο όλων των πινάκων, η οποία έρχεται σε αντίθεση με το γεγονός ότι το θεώρημα ισχύει για όλους τους διαγωνοποιήσιμους πίνακες. Έτσι, μπορεί κανείς να δει ότι το θεώρημα Cayley–Hamilton θα πρέπει να είναι αλήθεια.
Ενώ αυτό παρέχει μια έγκυρη απόδειξη (για πίνακες πάνω από τους μιγαδικούς αριθμούς), το επιχείρημα δεν είναι πολύ ικανοποιητικό, δεδομένου ότι οι ταυτότητες που αντιπροσωπεύεται από το θεώρημα σε καμία περίπτωση, δεν εξαρτώνται από τη φύση του πίνακα (διαγώνιος ή όχι), ούτε για το είδος των καταχωρήσεων επιτρέπεται (για πίνακες με πραγματική καταχωρήσεις οι διαγώνιοι αυτοί δεν σχηματίζουν ένα πυκνό σύνολο, και αν φαίνεται παράξενο, θα πρέπει να εξετάσετε μιγαδικούς πίνακες για να δείτε ότι το θεώρημα Cayley–Hamilton ισχύει και για αυτούς). Ως εκ τούτου, πρέπει τώρα να εξετάσετε μόνο τα επιχειρήματα που αποδεικνύουν το θεώρημα άμεσα για οποιαδήποτε πίνακα με τη χρήση αλγεβρικών χειρισμών, μόνο αυτά έχουν επίσης το πλεονέκτημα της εργασίας για πίνακες με καταχωρήσεις σε κάθε αντιμεταθετική δαχτυλίδι.
Υπάρχει μια μεγάλη ποικιλία από τέτοιες αποδείξεις από το θεώρημα Cayley–Hamilton, εκ των οποίων πολλές θα δοθούν εδώ. Διαφέρουν στο ποσό των αφηρημένων αλγεβρικών εννοιών που απαιτούνται για να κατανοήσουμε την απόδειξη. Η απλούστερες αποδείξεις χρησιμοποιούν μόνο εκείνες τις έννοιες που απαιτούνται για να διατυπώσουμε το θεώρημα (πίνακες, πολυώνυμα με αριθμητικές καταχωρήσεις, καθοριστικούς παράγοντες), αλλά περιλαμβάνει τεχνικές υπολογισμών που καθιστούν κάπως μυστηριώδη το γεγονός ότι μπορούν να οδηγήσουν ακριβώς στο σωστό συμπέρασμα. Είναι δυνατόν να αποφευχθούν τέτοιου είδους λεπτομέρειες, αλλά στην τιμή που περιλαμβάνει πιο λεπτές αλγεβρικές έννοιες: πολυωνύμων με συντελεστές σε ένα μη-αντιμεταθετική δαχτυλίδι, ή πίνακες με ασυνήθιστα είδη καταχωρίσεων.

Συζυγής πίνακες

Όλες οι αποδείξεις κάτω κάνουν χρήση της έννοιας του συζυγή πίνακα adj(M) ενός n×n πίνακα M, η μεταφορά του συμπαράγοντα μήτρα.
Αυτός είναι ένας πίνακας των οποίων οι συντελεστές δίνονται από πολυωνυμικές εκφράσεις των συντελεστών M (στην πραγματικότητα, από ορισμένους (n − 1)×(n − 1) καθοριστικούς παράγοντες), με τέτοιο τρόπο ώστε οι ακόλουθες θεμελιώδεις σχέσεις να είναι,

\( {\displaystyle \operatorname {adj} (M)\cdot M=\det(M)I_{n}=M\cdot \operatorname {adj} (M)~.} \) Οι σχέσεις αυτές αποτελούν άμεση συνέπεια των βασικών ιδιότητων των οριζουσών: αξιολόγηση της (i,j) την είσοδο του πίνακα προϊόντων στα αριστερά δίνει την επέκταση από τη στήλη j της ορίζουσας του πίνακα που λαμβάνεται από M αντικαθιστώντας στήλη i από αντίγραφο της στήλης j, το οποίο είναι det(M) αν i = j και μηδέν διαφορετικά * η μήτρα προϊόντων στα δεξιά είναι παρόμοια, αλλά για επεκτάσεις από σειρές.

Ήταν συνέπεια μιας αλγεβρικής έκφρασης , οι σχέσεις αυτές ισχύουν για πίνακες με καταχωρήσεις σε κάθε αντιμεταθετικό δαχτυλίδι (αντιμεταθετικός πρέπει να θεωρείται για τους καθοριστικούς παράγοντες για να καθοριστεί στην πρώτη θέση). Είναι σημαντικό να σημειωθεί εδώ, γιατί οι σχέσεις αυτές θα πρέπει να εφαρμόζονται για πίνακες με μη αριθμητικές καταχωρήσεις όπως πολυώνυμα.

Άμεση αλγεβρική απόδειξη

Η απόδειξη χρησιμοποιεί το είδος των αντικειμένων που απαιτούνται για να διατυπώσουμε το θεώρημα Cayley–Hamilton: πίνακες με πολυώνυμα ως καταχωρήσεις. Ο πίνακας t InA του οποίου η ορίζουσα είναι το χαρακτηριστικό πολυώνυμο του A είναι ένας πίνακας, και από τα πολυωνύμωνα αποτελούν ένα αντιμεταθετικό δαχτυλίδι, έχει ένα συζυγή.

\( {\displaystyle B=\operatorname {adj} (tI_{n}-A).} \) Στη συνέχεια, σύμφωνα με το "δεξί- χέρι" θεμελιώδη σχέση του συζυγή, έχει
\( {\displaystyle (tI_{n}-A)\cdot B=\det(tI_{n}-A)I_{n}=p(t)I_{n}~.} \) Το B είναι επίσης ένας πίνακας με πολυώνυμα σε t , για κάθε i γίνεται να επιλέξουν τους συντελεστές του ti σε κάθε είσοδο για να διαμορφώσει ένα πίνακα B i αριθμών, όπως αυτό έχει

\( {\displaystyle B=\sum _{i=0}^{n-1}t^{i}B_{i}~.} \)

(Ο τρόπος που ορίζονται οι είσοδοι της B , καθιστά σαφές ότι δεν υπάρχουν δυνάμεις ανώτερες από τον tn−1 ). Ενώ αυτό φαίνεται σαν ένας πίνακας με συντελεστές πολυώνυμα, δεν θα εξετάσει μια τέτοια έννοια, είναι απλώς ένας τρόπος για να γράψει ένα πίνακα με πολυώνυμο καταχωρήσεις ως γραμμικός συνδυασμός των n σταθερών πινάκων, και ο συντελεστής t i έχει γραφτεί αριστερά από τον πίνακα για να τονίσω αυτή την άποψη.

Τώρα, μπορεί κανείς να επεκτείνει τον πίνακα στην εξίσωση μας με bilinearity

\( {\displaystyle {\begin{aligned}p(t)I_{n}&=(tI_{n}-A)\cdot B\\&=(tI_{n}-A)\cdot \sum _{i=0}^{n-1}t^{i}B_{i}\\&=\sum _{i=0}^{n-1}tI_{n}\cdot t^{i}B_{i}-\sum _{i=0}^{n-1}A\cdot t^{i}B_{i}\\&=\sum _{i=0}^{n-1}t^{i+1}B_{i}-\sum _{i=0}^{n-1}t^{i}A\cdot B_{i}\\&=t^{n}B_{n-1}+\sum _{i=1}^{n-1}t^{i}(B_{i-1}-A\cdot B_{i})-A\cdot B_{0}~.\end{aligned}}} \)

Γράφοντας

\( {\displaystyle p(t)I_{n}=t^{n}I_{n}+t^{n-1}c_{n-1}I_{n}+\cdots +tc_{1}I_{n}+c_{0}I_{n}~,} \)

κάποιος αποκτά ισότητα των δύο πινάκων με πολυώνυμο καταχωρήσεις, γραμμένοι ως γραμμικοί συνδυασμοί των σταθερών πινάκων με τις δυνάμεις του t ως συντελεστές.

Μια τέτοια ισότητα μπορεί να κρατήσει μόνο αν σε κάθε πίνακα τη θέση της καταχώρησης που πολλαπλασιάζεται με μια δεδομένη δύναμη ti είναι το ίδιο και στις δύο πλευρές, προκύπτει ότι οι σταθεροί πίνακες

\( {\displaystyle B_{n-1}=I_{n},\qquad B_{i-1}-A\cdot B_{i}=c_{i}I_{n}\quad {\text{for }}1\leq i\leq n-1,\qquad -AB_{0}=c_{0}I_{n}~.} \)
Τέλος, πολλαπλασιάζουμε την εξίσωση των συντελεστών του ti από τα αριστερά από το Ai, και να συνοψίσω: το αριστερό χέρι πλευρές σχηματίζουν ένα τηλεσκοπικό άθροισμα και να ακυρώσει εντελώς, από την οποία προκύπτει η εξίσωση

\( {\displaystyle 0=A^{n}+c_{n-1}A^{n-1}+\cdots +c_{1}A+c_{0}I_{n}=p(A)~.} \)
Αυτό ολοκληρώνει την απόδειξη

Απόδειξη χρησιμοποιώντας πολυώνυμα με συντελεστές πίνακες
Αυτή η απόδειξη είναι παρόμοια με την πρώτη, αλλά προσπαθεί να δώσει νόημα στην έννοια της πολυώνυμο με συντελεστές πίνακες που προτάθηκε από τις εκφράσεις που εμφανίζονται στην απόδειξη. Αυτό απαιτεί μεγάλη προσοχή, αφού είναι κάπως ασυνήθιστο η εξέταση πολυωνύμων με συντελεστές σε ένα μη-αντιμεταθετικό δαχτυλίδι, και όχι όλο το σκεπτικό που ισχύει για αντιμεταθετικά πολυώνυμα μπορεί να εφαρμοστεί σε αυτή τη ρύθμιση
Συγκεκριμένα, όσο η αριθμητική των πολυωνύμων είναι πάνω από ένα αντιμεταθετικό δαχτύλιο η αριθμητική τιμή του πολυωνύμου λειτουργίες, αυτό δεν είναι η περίπτωση πάνω από ένα μη-αντιμεταθετικό δαχτύλιο (στην πραγματικότητα δεν υπάρχει προφανής έννοια της πολυωνυμικής συνάρτησης σε αυτή την περίπτωση που είναι κλειστό κάτω από τον πολλαπλασιασμό). Έτσι, όταν εξετάζουμε πολυώνυμα σε t με συντελεστές πίνακες, η μεταβλητή t δεν πρέπει να θεωρηθεί ως ένα "άγνωστο", αλλά ως επίσημο σύμβολο που είναι να χειραγωγηθεί σύμφωνα με δεδομένους κανόνες * ειδικότερα, δεν μπορεί κανείς να απλά ρυθμίσει t σε μια συγκεκριμένη τιμή.
\( {\displaystyle (f+g)(x)=\sum _{i}\left(f_{i}+g_{i}\right)x^{i}=\sum _{i}{f_{i}x^{i}}+\sum _{i}{g_{i}x^{i}}=f(x)+g(x)} \)
Ας M(n, R) είναι ο δακτύλιος των n×n πινάκων με καταχωρήσεις σε ορισμένες δακτυλίου R (όπως οι πραγματικοί ή μιγαδικοί αριθμοί) που έχει A στοιχείο. Πίνακες με τους συντελεστές πολυωνύμων σε t, όπως t I n − A {\displaystyle tI_{n}-A} {\displaystyle tI_{n}-A} ή τον συζυγή Β στην πρώτη απόδειξη, είναι στοιχεία του M(n, R[t]).
Από τη συλλογή σαν δυνάμεις του t, τόσο ο πίνακας μπορεί να γραφτεί ως "πολυώνυμα" σε t με σταθερούς πίνακες ως συντελεστές, γράψτε M(n, R)[t] για το σύνολο αυτών των πολυωνύμων. Από αυτό το σύνολο είναι σε ισομορφισμό με M(n, R[t]), ορίζει αριθμητικές πράξεις πάνω αντίστοιχα, ιδίως πολλαπλασιασμό δίνεται από

\( {\displaystyle \left(\sum _{i}M_{i}t^{i}\right)\cdot \left(\sum _{j}N_{j}t^{j}\right)=\sum _{i,j}(M_{i}\cdot N_{j})t^{i+j},} \)

τηρώντας την εντολή του συντελεστή πίνακα από τους δύο τελεστές * προφανώς αυτό δίνει μια μη-αντιμεταθετικό πολλαπλασιασμό
Έτσι, η ταυτότητα

\( {\displaystyle (tI_{n}-A)\cdot B=p(t)I_{n}.} \)
από την πρώτη απόδειξη μπορεί να θεωρηθεί ως συνεπαγωγή του πολλαπλασιασμού των στοιχείων M(n, R)[t].

Σε αυτό το σημείο, είναι δελεαστικό να ρυθμίσετε απλά t ίσομε τον πίνακα A , που κάνει ο πρώτος παράγοντας στα αριστερά ίσο με το μηδενικό πίνακα, και η δεξιά πλευρά ίση με p(A) * ωστόσο, αυτό δεν είναι μια επιτρεπτή λειτουργία όταν συντελεστές δεν μετακινούνται. Είναι δυνατόν να ορίσετε μια "δεξιά-αξιολόγηση χάρτη" evA : M[t] → M, το οποίο αντικαθιστά κάθε ti από τον πίνακα δύναμης A - από A , όπου ορίζει ότι η δύναμη πρέπει πάντα να πολλαπλασιάζεται από τα δεξιά του αντίστοιχου συντελεστή
Αλλά αυτό δεν είναι το δαχτυλίδι ομομορφισμού: η σωστή αξιολόγηση ενός προϊόντος διαφέρει σε γενικές γραμμές από το προϊόν των σωστά-αξιολογήσεις. Αυτό συμβαίνει επειδή ο πολλαπλασιασμός πολυωνύμων με συντελεστές πίνακες δεν τυποποιεί τον πολλαπλασιασμό των εκφράσεων που περιέχουν αγνώστους: ένα προϊόν \( {\displaystyle Mt^{i}Nt^{j}=(M\cdot N)t^{i+j}} \)ορίζεται αν υποθέσουμε ότι t πηγαινοέρχεται με το N, αλλά αυτό μπορεί να αποτύχει, εάν t αντικαθίσταται από τον πίνακα Α.☃☃
Μπορεί κανείς να επιλύσει αυτό το πρόβλημα με την συγκεκριμένη κατάσταση με το χέρι, δεδομένου ότι το ανωτέρω δικαίωμα-αξιολόγηση γίνει ένα δαχτυλίδι ομομορφισμού αν ο πίνακας A είναι το κέντρο του δακτυλίου των συντελεστών, έτσι ώστε να πηγαινοέρχεται με όλους τους συντελεστές των πολυωνύμων (το επιχείρημα που αποδεικνύει αυτή είναι απλή, ακριβώς επειδή μετακινήσεις t με συντελεστές είναι πλέον δικαιολογημένη μετά από αξιολόγηση).
Τώρα, A δεν είναι πάντα στο κέντρο του M, αλλά μπορεί να αντικαταστήσει M με ένα μικρότερο δακτύλιο με την προϋπόθεση ότι περιέχει όλους τους συντελεστές των πολυωνύμων: \( {\displaystyle I_{n}} \), Aκαι οι συντελεστές \({\displaystyle B_{i}} \) του πολυωνύμου B. Η προφανής επιλογή για έναν τέτοιον υποδακτύλιο είναι ο κεντροποιητής Z από A, ο υποδακτύλιος όλων των πινάκων που μετακινούνται με A;, εξ ορισμού, A είναι στο κέντρο του Z.
Αυτός ο κεντροποιητης προφανώς περιέχει \( {\displaystyle I_{n}} \)και A, αλλά το ένα έχει να δείξει ότι αυτό περιέχει τους πίνακες \( {\displaystyle B_{i}} \). Για να το κάνετε αυτό, ένα συνδυάζει τις δύο βασικές σχέσεις για τα συζυγή, γράφοντας το συζυγή Β ως πολυώνυμο:

\( {\displaystyle {\begin{aligned}\left(\sum _{i=0}^{m}B_{i}t^{i}\right)(tI_{n}-A)&=(tI_{n}-A)\sum _{i=0}^{m}B_{i}t^{i}\\\sum _{i=0}^{m}B_{i}t^{i+1}-\sum _{i=0}^{m}B_{i}At^{i}&=\sum _{i=0}^{m}B_{i}t^{i+1}-\sum _{i=0}^{m}AB_{i}t^{i}\\\sum _{i=0}^{m}B_{i}At^{i}&=\sum _{i=0}^{m}AB_{i}t^{i}.\end{aligned}}} \)
Εξισώνοντας τους συντελεστές που δείχνει ότι για κάθε i, έχουμε A B - = B - A , όπως είναι επιθυμητό. Έχοντας βρει το κατάλληλο σκηνικό στο οποίο evA είναι πράγματι ένας ομομορφισμός δαχτύλιος, μπορεί κανείς να ολοκληρώσει την απόδειξη, όπως προτείνεται παραπάνω:
\( {\displaystyle {\begin{aligned}\operatorname {ev} _{A}{\bigl (}p(t)I_{n}{\bigr )}&=\operatorname {ev} _{A}((tI_{n}-A)\cdot B)\\p(A)&=\operatorname {ev} _{A}(tI_{n}-A)\cdot \operatorname {ev} _{A}(B)\\p(A)&=(A\cdot I_{n}-A)\cdot \operatorname {ev} _{A}(B)=0\cdot \operatorname {ev} _{A}(B)=0.\end{aligned}}} \)

Αυτό ολοκληρώνει την απόδειξη

Μια σύνθεση των δύο πρώτων αποδείξεων
Στην πρώτη απόδειξη , ένα ήταν σε θέση να προσδιορίσει τους συντελεστές Bi της Β βασίζεται στο δεξί-χέρι θεμελιώδης σχέση μόνο για το συζυγές . Στην πραγματικότητα, οι πρώτες n εξισώσεις που προέρχονται μπορούν να ερμηνευθούν ως τον καθορισμό του πηλίκου Β της Ευκλείδειας διαίρεσης του πολυωνύμου p ( t ) στα αριστερά από το μονικό πολυώνυμο Int -Α , ενώ η τελική εξίσωση εκφράζει το γεγονός ότι το υπόλοιπο είναι μηδέν . Η διαίρεση αυτή εκτελείται στο δακτύλιο πολυωνύμων με συντελεστές . Πράγματι , ακόμη και πάνω από ένα μη ισόμορφο δαχτύλιο , Ευκλείδεια διαίρεση με ένα μονικό πολυώνυμο P ορίζεται , και παράγει πάντα ένα μοναδικό πηλίκο και υπόλοιπο με την ίδια κατάσταση βαθμό όπως στην αντιμεταθετική περίπτωση , υπό την προϋπόθεση ότι έχει καθοριστεί σε ποια πλευρά κάποιος επιθυμεί P για να είναι ένας παράγοντας ( εδώ που είναι προς τα αριστερά ) . Για να δείτε ότι το πηλίκο και το υπόλοιπο είναι το μοναδικό (το οποίο είναι το σημαντικό μέρος της δήλωση εδώ), αρκεί να γράψετε \( {\displaystyle PQ+r=PQ'+r'} \) ως \( {\displaystyle P(Q-Q')=r'-r} \) και παρατηρούμε ότι από το P είναι μονικό, P(Q−Q') δεν μπορεί να έχει βαθμό μικρότερο από αυτό του P, εκτός αν Q=Q' .
Αλλά το μέρισμα p(t)In και ο διαιρέτης Int−A χρησιμοποιείται εδώ και οι δύο βρίσκονται στον υποδαχτύλιο (R[A])[t], όπου R[A] είναι ο υποδαχτύλιος του πίνακα δακτυλίου M(n, R) που παράγεται από A: το R-γραμμική έκταση του όλες τις εξουσίες του A. Ως εκ τούτου, η Ευκλείδεια διαίρεση, μπορεί στην πραγματικότητα να πραγματοποιηθεί εντός αντιμεταθετικό πολυώνυμο δαχτύλιο, και φυσικά στη συνέχεια να δίνει το ίδιο πηλίκο B και υπόλοιπο 0 ως το μεγαλύτερο δαχτυλίδι * ειδικότερα, αυτό δείχνει ότι B βρίσκεται στο (R[A])[t].
Αλλά, σε αυτή την αντιμεταθετική ρύθμιση, είναι έγκυρη για να ρυθμίσετε t να A στην εξίσωση

\( {\displaystyle p(t)I_{n}=(I_{n}t-A)B}* \) με άλλα λόγια, να εφαρμόσει την αξιολόγηση χάρτης
\( {\displaystyle \operatorname {ev} _{A}:(R[A])[t]\to R[A]} \) το οποίο είναι ένα δαχτυλίδι homomorphism, δίνοντας
\( {\displaystyle p(A)=0\cdot \operatorname {ev} _{A}(B)=0} \) όπως και στη δεύτερη απόδειξη, όπως είναι επιθυμητό.

Επιπλέον να αποδεικνύει το θεώρημα, το παραπάνω επιχείρημα, μας λέει ότι οι συντελεστές Bi της B είναι πολυώνυμα σε A, ενώ από την δεύτερη απόδειξη ξέραμε μόνο ότι λένε ψέματα στον κεντροποιητή Z από A γενικά, Z είναι ένας μεγαλύτερος υποδαχτύλιος από R[A], και όχι απαραίτητα αντιμεταθετικός. Ειδικότερα ο σταθερός όρος B0= adj(−A) έγκειται στο R[A]. Από το A είναι ένας αυθαίρετος τετραγωνικός πίνακας, αυτό αποδεικνύει ότι adj(A) μπορεί πάντα να εκφραστεί ως ένα πολυώνυμο A (με συντελεστές που εξαρτώνται από A).
Στην πραγματικότητα, οι εξισώσεις που βρέθηκαν στην πρώτη απόδειξη επιτρέπουν διαδοχικά εκφράζοντας\( {\displaystyle B_{n-1},\ldots ,B_{1},B_{0}} \) ως πολυώνυμα σε A, το οποίο οδηγεί στην ταυτότητα
ισχύει για όλα τα n×n πίνακες, που
\( {\displaystyle p(t)=t^{n}+c_{n-1}t^{n-1}+\cdots +c_{1}t+c_{0}} \)
είναι το χαρακτηριστικό πολυώνυμο του A.
Σημειώστε ότι αυτή η ταυτότητα συνεπάγεται επίσης τη δήλωση από το θεώρημα Cayley–Hamilton: μπορεί κανείς να κινηθεί adj(−A) στην δεξιά πλευρά, πολλαπλασιάστε το αποτέλεσμα της εξίσωσης (αριστερά ή δεξιά) από τη A, και το γεγονός ότι

\( {\displaystyle -A\cdot \operatorname {adj} (-A)=\operatorname {adj} (-A)\cdot (-A)=\det(-A)I_{n}=c_{0}I_{n}.} \)

Απόδειξη χρησιμοποιώντας πίνακες ενδομορφισμού

Όπως αναφέρθηκε παραπάνω, ο πίνακας p(A) σε δήλωση του θεωρήματος προκύπτει υπολογίζοντας πρώτα την ορίζουσα και, στη συνέχεια, αντικαθιστώντας τον πίνακα Α με t,το να γίνει αυτή η αντικατάσταση στον πίνακα \({\displaystyle tI_{n}-A} \) πριν από τον υπολογισμό της ορίζουσαν είναι ανούσιο. Παρ ' όλα αυτά, είναι δυνατόν να δωθεί μια ερμηνεία όπου ο p(A) προκύπτει άμεσα ως η τιμή μίας συγκεκριμένης ορίζουσας, αλλά αυτό απαιτεί μια πιο περίπλοκη ρύθμιση, έναν εκ των πινάκων πάνω από τον δακτύλιο στον οποίο μπορεί κανείς να ερμηνεύσει τόσο τις καταχωρήσεις \( {\displaystyle A_{i,j}} \) του Α και τον ίδιο τον Α . Θα μπορούσε κανείς να πάρει αυτόν τον δαχτύλιο M(n, R) των n×n πινάκων πάνω από το R, όπου η καταχώρηση \( {\displaystyle A_{i,j}} \) γίνεται αντιληπτή, ως \( {\displaystyle A_{i,j}I_{n}} \) και ως ο ίδιος ο Α . Αλλά, λαμβάνοντας υπόψη πίνακες με πίνακες, ως καταχωρήσεις μπορεί να προκαλέσει σύγχυση με το μπλοκ πίνακες, το οποίο δεν είναι επιθυμητό, καθώς αυτό δίνει τη λάθος έννοια της ορίζουσας (υπενθυμίζεται ότι η ορίζουσα ενός πίνακα ορίζεται ως το σύνολο του γινομένου των καταχωρήσεων, και στη περίπτωση ενός μπλοκ πίνακα αυτό γενικά δεν είναι το ίδιο όπως και το αντίστοιχο άθροισμα από των γινομένων των πινάκων!). !). Είναι πιο σαφές να διαχωρίσουμε τον Α από τον ενδομορφισμό φ ενός n-διάστατου διανυσματικού χώρου V (ή ελεύθερου R-module αν το R δεν είναι ένα πεδίο), το οποίο ορίζεται από αυτό σε μια βάση e1, ..., en, και για να παρθούν πίνακες πάνω από τον δακτύλιο End(V) όλων αυτών των ενδομορφισμών. Στη συνέχεια, φ ∈ End(V) είναι μια πιθανή καταχώρηση για τον πίνακα, ενώ ο Α παράγει το στοιχείο του M(n, και End(V)), του οποίου i,j καταχώρηση είναι ενδομορφισμός του κλιμακωτού πολλαπλασιασμού κατά \( {\displaystyle A_{i,j}} \), ομοίως o In θα πρέπει να ερμηνευθεί ως στοιχείο του M(n, και End(V)). Ωστόσο, αφού End(V) δεν είναι αντιμεταθετικός δακτύλιος, καμία ορίζουσα δεν ορίζεται στο M(n, και End(V)). αυτό μπορεί να γίνει μόνο για πίνακες πάνω από έναν αντιμεταθετικό υποδακτύλιο του End(V). Τώρα οι καταχωρήσεις του πίνακα \( {\displaystyle \varphi I_{n}-A} \) , βρίσκονται στον υποδακτύλιο R[φ] που παράγεται από το ταυτοτικό στοιχείο και την φ, η οποία είναι αντιμεταθετική. Στη συνέχεια, μία καθοριστική αντιστοίχηση M(n, R[φ]) → R[φ] ορίζεται, και \( {\displaystyle \det(\varphi I_{n}-A)} \) υπολογίζει την τιμή p(φ) του χαρακτηριστικού πολυωνύμου του Α στο φ (αυτό ισχύει ανεξάρτητα από τη σχέση μεταξύ των Α και δ). το θεώρημα Cayley–Hamilton δηλώνει ότι p(φ) είναι το κενός ενδομορφισμός.

Σε αυτή τη μορφή, η ακόλουθη απόδειξη μπορεί να ληφθεί από αυτή (Atiyah & MacDonald 1969, Prop. 2.4) (η οποία στην πραγματικότητα είναι η πιο γενική δήλωση που συνδέεται με την Nakayama λήμμα * η οποία χρειάζεται κατ' εκδοχήν σε αυτή την πρόταση ολόκληρο τον δακτύλιο R). Το γεγονός ότι ο Α είναι ο πίνακας της φ στην βάση e1, ..., en σημαίνει ότι

\( {\displaystyle \varphi (e_{i})=\sum _{j=1}^{n}A_{j,i}e_{j}\quad {\text{for }}i=1,\ldots ,n.} \)

Μπορεί κανείς να ερμηνεύσει αυτές, ως n στοιχεία μιάς εξίσωσης στον Vn, τα μέλη της οποίας μπορούν να γραφτούν χρησιμοποιώντας τον βαθμωτό πίνακα διανυσμάτων M(n, και End(V)) × Vn → Vn που ορίζεται ως συνήθως, αλλά με ξεχωριστές καταχωρήσεις ψ ∈ End(V) και το v στον V "πολλαπλασιάζεται" με τη διαμορφώνοντας το \( {\displaystyle \psi (v)} \), αυτό δίνει:

\( {\displaystyle \varphi I_{n}\cdot E=A^{\mathrm {tr} }\cdot E,} \)

όπου \( {\displaystyle E\in V^{n}} \) είναι το στοιχείο του οποίου η συνιστώσα i θα είναι ei (με άλλα λόγια, είναι η βάση e1, ..., en του V που γράφεται ως μια στήλη διανυσμάτων). Γράφοντας αυτή την εξίσωση ως

\( {\displaystyle (\varphi I_{n}-A^{\mathrm {tr} })\cdot E=0\in V^{n}} \)

κάποιος αναγνωρίζει τη μετατόπιση του πίνακα \( {\displaystyle \varphi I_{n}-A} \)που μελετήθηκε παραπάνω, και την ορίζουσά του (ως στοιχείο του M(n, R[φ])) είναι επίσης σ(φ). Αυτό που απορρέει από αυτή την εξίσωση ειναι ότι σ(φ) = 0 ∈ Ενδ(V), που πολλαπλασιάζεται από αριστερά με τον συζυγή πίνακα της \( {\displaystyle \varphi I_{n}-A^{\mathrm {tr} }} \), ο οποίος ορίζεται στον πίνακα δακτυλίου M(n, R[φ]), δίνοντας

\( {\displaystyle {\begin{aligned}0&=\operatorname {adj} (\varphi I_{n}-A^{\mathrm {tr} })\cdot ((\varphi I_{n}-A^{\mathrm {tr} })\cdot E)\\&=(\operatorname {adj} (\varphi I_{n}-A^{\mathrm {tr} })\cdot (\varphi I_{n}-A^{\mathrm {tr} }))\cdot E\\&=(\det(\varphi I_{n}-A^{\mathrm {tr} })I_{n})\cdot E\\&=(p(\varphi )I_{n})\cdot E;\end{aligned}}} \)

η συσχέτιση πίνακα-πίνακα και πίνακα-διανυσματικών πολλαπλάσιων που χρησιμοποιείται κατά το πρώτο βήμα είναι μια καθαρά τυπική ιδιότητα των πράξεων αυτών, ανεξάρτητα από τη φύση των καταχωρήσεων. Τώρα η συνιστώσα i αυτής της εξίσωσης λέει ότι σ(φ)(e ' ) = 0 ∈ V. έτσι p(φ) απαλοίφει όλα τα ei, και δεδομένου ότι τα στοιχεία αυτά παράγουν τον V έπεται ότι σ(φ) = 0 ∈ End(V), ολοκληρώνοντας την απόδειξη.

Ένα επιπλέον γεγονός που προκύπτει από αυτή απόδειξη είναι ότι ο πίνακας Α του οποίου το χαρακτηριστικό πολυώνυμο έχει βρεθεί δεν χρειάζεται να είναι ταυτόσημο με την τιμή του φ το οποίο αντικαταστάται σε αυτό το πολυώνυμο * αρκεί ότι η φ είναι ένας ενδομορφισμός του V που ικανοποιεί τις αρχικές εξισώσεις

\( {\displaystyle \varphi (e_{i})=\sum _{j}A_{j,i}e_{j}} \)

για κάποια ακολουθία στοιχείων του e1,...,en που παράγουν τον V (ο χώρος αυτός μπορεί να έχει μικρότερη διάσταση από n, ή σε περίπτωση που ο δακτύλιος R δεν είναι σώμα μπορεί να μην είναι ένα ελεύθερο συζυγές τελικά ).
Μία ψευδής "απόδειξη": p(A) = det(AIn − A) = det(A − A) = 0

Μια συνεχές στοιχειώδες αλλά εσφαλμένο όρισμα[18] για το θεώρημα είναι "απλά" να πάρετε τον ορισμό

\( {\displaystyle p(\lambda )=\det(\lambda I_{n}-A)} \)

και να αντικαταστήσετε τον Α με λ, λαμβάνοντας

\( {\displaystyle p(A)=\det(AI_{n}-A)=\det(A-A)=0~.} \)

Υπάρχουν πολλοί τρόποι για να δείτε γιατί αυτό το όρισμα είναι λάθος. Πρώτον, στο θεώρημα Cayley–Hamilton,ο p(A) είναι ένας n×n πίνακας. Ωστόσο, στο δεξί μέρος της παραπάνω εξίσωσης είναι η τιμή της ορίζουσας, η οποία είναι κλιμακωτή. Έτσι, δεν μπορούν να εξισωθούν, εκτός αν n = 1 (δηλ. ο Α είναι απλά κλιμακωτός). Δεύτερον, στην έκφραση \( {\displaystyle \det(\lambda I_{n}-A)} \), η μεταβλητή λ προκύπτει στην πραγματικότητα στις διαγώνιες καταχωρήσεις του πίνακα \( {\displaystyle \lambda I_{n}-A} \). Για παράδειγμα, σκεφτείτε το χαρακτηριστικό πολυώνυμο στο προηγούμενο παράδειγμα πάλι:

det ( λ − 1 − 2 − 3 λ − 4 ) . {\displaystyle \det {\begin{pmatrix}\lambda -1&-2\\-3&\lambda -4\end{pmatrix}}.} {\displaystyle \det {\begin{pmatrix}\lambda -1&-2\\-3&\lambda -4\end{pmatrix}}.}

Αν κάποιος αντικαταστήσει όλο τον πίνακα Α με λ σε αυτές τις θέσεις, παίρνει

\( } {\displaystyle \det {\begin{pmatrix}{\begin{pmatrix}1&2\\3&4\end{pmatrix}}-1&-2\\-3&{\begin{pmatrix}1&2\\3&4\end{pmatrix}}-4\end{pmatrix}},} \)

κατά την οποία η έκφραση "πίνακας" απλά δεν είναι έγκυρη. Σημειώστε, ωστόσο, ότι ,αν αφαιρούνται κατά τα παραπάνω, βαθμωτά πολλαπλάσια του ταυτοτικού πίνακα αντί για βαθμωτά, δηλ. αν η αντικατάσταση γίνεται ως

\( {\displaystyle \det {\begin{pmatrix}{\begin{pmatrix}1&2\\3&4\end{pmatrix}}-I_{2}&-2I_{2}\\-3I_{2}&{\begin{pmatrix}1&2\\3&4\end{pmatrix}}-4I_{2}\end{pmatrix}},} \)

τότε η ορίζουσα είναι όντως μηδέν, αλλά ο ανεπτυγμένος πίνακας δεν υπολογίζεται από A I n − A {\displaystyle AI_{n}-A} {\displaystyle AI_{n}-A} ούτε μπορεί η ορίζουσά του (κλιμακωτή) να συγκριθεί με του p(A) (πίνακα). Οπότε το όρισμα ότι p ( A ) = det ( A I n − A ) = 0 {\displaystyle p(A)=\det(AI_{n}-A)=0} {\displaystyle p(A)=\det(AI_{n}-A)=0} ακόμα δεν μπορεί να εφαρμοσθεί.

Στην πραγματικότητα, αν ένα τέτοιο όρισμα ισχύει,πρέπει επίσης να ισχύει όταν άλλες πολυγραμμικές μορφές , αντί για την ορίζουσα, χρησιμοποιούνται. Για παράδειγμα, αν θεωρήσουμε μία σταθερή συνάρτηση και την ορίσουμε \( {\displaystyle q(\lambda )=\operatorname {perm} (\lambda I_{n}-A)} \) και στη συνέχεια, με το ίδιο όρισμα, θα πρέπει να είμαστε σε θέση να "αποδείξουμε" ότι q(A) = 0. Αλλά αυτός ο ισχυρισμός είναι αποδεδειγμένα λάθος. Στη 2-διάστατο περίπτωση, για παράδειγμα, η ορίζουσα ενός πίνακα δίνεται από

\( {\displaystyle \operatorname {perm} {\begin{pmatrix}a&b\\c&d\end{pmatrix}}=ad+bc.} \)

Έτσι, για τον πίνακα Α του προηγούμενου παραδείγματος,

\( {\displaystyle {\begin{aligned}q(\lambda )&=\operatorname {perm} (\lambda I_{2}-A)=\operatorname {perm} {\begin{pmatrix}\lambda -1&-2\\-3&\lambda -4\end{pmatrix}}\\[6pt]&=(\lambda -1)(\lambda -4)+(-2)(-3)=\lambda ^{2}-5\lambda +10.\end{aligned}}} \)

Ακόμα μπορεί κανείς να επαληθεύσει ότι

\( {\displaystyle q(A)=A^{2}-5A+10I_{2}=12I_{2}\not =0.} \)

Μία από τις αποδείξεις για το θεώρημα Cayley–Hamilton παραπάνω φέρει κάποια ομοιότητα με το όρισμα ότι το \( {\displaystyle p(A)=\det(AI_{n}-A)=0} \). Με την εισαγωγή ενός πίνακα με μη αριθμητικούς συντελεστές, μπορεί κανείς να αφήσει τον Α ως καταχώρηση σε έναν πίνακα, αλλά μετά ο \( {\displaystyle AI_{n}} \) δεν είναι ίσος με Α, και το συμπέρασμα είναι διαφορετικό.
Αφηρημένες έννοιες και γενικεύσεις

Οι παραπάνω αποδείξεις δείχνουν ότι το θεώρημα Cayley–Hamilton ισχύει για πίνακες με καταχωρήσεις σε κάθε αντιμεταθετικό δακτυλίο R, και ότι σ(φ) = 0 θα ισχύει όποτε φ είναι ένας ενδομορφισμός συζυγής του R που παράγεται από στοιχεία του e1,...,en και που να ικανοποιεί

\( {\displaystyle \varphi (e_{j})=\sum a_{ij}e_{i},\qquad j=1,\ldots ,n.} \)

Αυτή η πιο γενική εκδοχή του θεωρήματος είναι η πηγή του καταξιωμένου Nakayama λήμμα στην αντιμεταθετική άλγεβρα και αλγεβρική γεωμετρία.

Δείτε επίσης

Companion matrix

Παρατηρήσεις

1.Λόγω της μη-αντιμεταθετικής φύση της πολλαπλασιαστικής διαδικασίας για τους τετραδικούς αριθμούς και τις συναφείς κατασκευές, πρέπει να υπάρχει προσοχή με τους ορισμούς, ιδίως στο σημείο αυτό, με την ορίζουσα. Το θεώρημα ισχύει και για διαιρεμένους τετραδικούς αριθμούς που δε συμπεριφέρονται το ίδιο καλά, δείτε Alagös, Oral & Yüce (2012). Οι δακτύλιοι των τετραδικών αριθμών και των διαιρεμένων τετραδικών αριθμών μπορούν και να αναπαρασταθούν από ορισμένους 2 × 2μιγαδικούς πίνακες. (Όταν περιορίζεται σε μοναδιαία νόρμα, αυτές είναι οι ομάδες SU(2) και SU(1, 1) , αντίστοιχα.) Ως εκ τούτου, δεν είναι έκπληξη το γεγονός ότι το θεώρημα ισχύει.

Δεν υπάρχει τέτοια αναπαράσταση πίνακα για τα octonions, καθώς η διαδικασία του πολλαπλασιασμού δεν είναι προσεταιριστική σε αυτή την περίπτωση.Ωστόσο, ένα τροποποιημένο θεώρημα του Cayley-Hamilton εξακολουθεί να ισχύει για τα octonions, δείτε Tian (2000).

2.Μία ρητή έκφραση αυτών των συντελεστών είναι

\( {\displaystyle c_{i}=\sum _{k_{1},k_{2},\ldots ,k_{n}}\prod _{l=1}^{n}{\frac {(-1)^{k_{l}+1}}{l^{k_{l}}k_{l}!}}\mathrm {tr} (A^{l})^{k_{l}},} \)

όπου το άθροισμα λαμβάνεται πάνω από τα σύνολα όλων ακέραιο διαμερίσεων kl ≥ 0 που ικανοποιούν την εξίσωση

\( {\displaystyle \sum _{l=1}^{n}lk_{l}=n-i.} \)

3.Βλ., π. χ., σελ. 54 του Brown 1994, η οποία λύνει Jacobi φόρμουλα,

\( {\displaystyle \partial p(\lambda )/\partial \lambda =p(\lambda )\sum _{m=0}^{\infty }\lambda ^{-(m+1)}\operatorname {tr} A^{m}=p(\lambda )~\operatorname {tr} {\frac {I}{\lambda I-A}}\equiv \operatorname {tr} B~,} \)

όπου B είναι ο συζυγής πίνακας της επόμενης ενότητας. Υπάρχει επίσης ένα ισοδύναμο, που σχετίζεται με αναδρομικό αλγόριθμο που εισήγαγαν οι Urbain Le Verrier και Ντμίτρι Konstantinovich Faddeev—το Faddeev–LeVerrier αλγόριθμοςπου δείχνει

\( {\displaystyle {\begin{aligned}M_{0}&\equiv 0&c_{n}&=1\qquad &(k=0)\\M_{k}&\equiv AM_{k-1}-{\frac {1}{k-1}}(\mathrm {tr} (AM_{k-1}))I\qquad \qquad &c_{n-k}&=-{\frac {1}{k}}\mathrm {tr} (AM_{k})\qquad &k=1,\ldots ,n~.\end{aligned}}} \)

(βλ., π. χ., σ 88 της Gantmacher 1960.) Παρατηρείται A−1 = − Mn /c0, καθώς η επανάληψη τερματίζει. Δείτε την αλγεβρική απόδειξη στην παρακάτω ενότητα, που στηρίζεται στις λειτουργίες του συζυγούς, Bk ≡ Mn−k . Συγκεκριμένα, \( {\displaystyle (\lambda I-A)B=Ip(\lambda )} \) και η παραπάνω παράγωγος της p όταν ένα ίχνος αποδίδεται

\( {\displaystyle \lambda p'-np=\operatorname {tr} AB~,} \) (Hou 1998), και η παραπάνω αναδρομή, με τη σειρά της.


Παρατηρήσεις

Due to the non-commutative nature of the multiplication operation for quaternions and related constructions, care needs to be taken with definitions, most notably in this context, for the determinant.
An explicit expression for these coefficients is

See, e.g., p. 54 of Brown 1994, which solves Jacobi's formula,

Παραπομπές

Crilly 1998
Cayley 1858, σελίδες 17–37
Cayley 1889, σελίδες 475–496
Atiyah & MacDonald 1969
Hamilton 1853, σελ. 562
Hamilton 1864a
Hamilton 1864b
Hamilton 1862
Zhang 1997
Frobenius 1878
Zeni & Rodrigues 1992
Barut, Zeni & Laufer 1994a
Barut, Zeni & Laufer 1994b
Laufer 1997
Curtright, Fairlie & Zachos 2014
Frobenius 1878
Bhatia 1997, p. 7

Bhatia 1997, p. 7

Βιβλιογραφία

Alagös, Y.; Oral, K.; Yüce, S. (2012). «Split Quaternion Matrices». Miskolc Mathematical Notes 13 (2): 223–232. ISSN 1787-2405none
Alagös, Y.; Oral, K.; Yüce, S. (2012). «Split Quaternion Matrices». Miskolc Mathematical Notes 13 (2): 223–232. ISSN 1787-2405none (open access)
Atiyah, M. F.; MacDonald, I. G. (1969), Introduction to Commutative Algebra, Westview Press, ISBN 0-201-40751-5
Barut, A. O.; Zeni, J. R.; Laufer, A. (1994a). «The exponential map for the conformal group O(2,4)». J. Phys. A: Math. Gen. (IOPScience) 27 (15): 5239–5250. doi:10.1088/0305-4470/27/15/022. Bibcode: 1994JPhA...27.5239B.
Barut, A. O.; Zeni, J. R.; Laufer, A. (1994a). «The exponential map for the conformal group O(2,4)». J. Phys. A: Math. Gen. (IOPScience) 27 (15): 5239–5250. doi:10.1088/0305-4470/27/15/022. Bibcode: 1994JPhA...27.5239B.
Barut, A. O.; Zeni, J. R.; Laufer, A. (1994b). «The exponential map for the unitary group SU(2,2)». J. Phys. A: Math. Gen. (IOPScience) 27 (20): 6799–6806. doi:10.1088/0305-4470/27/20/017. Bibcode: 1994JPhA...27.6799B.
Barut, A. O.; Zeni, J. R.; Laufer, A. (1994b). «The exponential map for the unitary group SU(2,2)». J. Phys. A: Math. Gen. (IOPScience) 27 (20): 6799–6806. doi:10.1088/0305-4470/27/20/017. Bibcode: 1994JPhA...27.6799B.
Bhatia, R. (1997). Matrix Analysis. Graduate texts in mathematics. 169. Springer. ISBN 978-0387948461.
Bhatia, R. (1997). Matrix Analysis. Graduate texts in mathematics. 169. Springer. ISBN 978-0387948461.
Brown, Lowell S. (1994). Quantum Field Theory. Cambridge University Press. ISBN 978-0-521-46946-3.
Brown, Lowell S. (1994). Quantum Field Theory. Cambridge University Press. ISBN 978-0-521-46946-3.
Cayley, A. (1858). «A Memoir on the Theory of Matrices». Phil.Trans. 148.
Cayley, A. (1858). «A Memoir on the Theory of Matrices». Phil.Trans. 148.
Cayley, A. (1889). The Collected Mathematical Papers of Arthur Cayley. (Classic Reprint). 2. Forgotten books. ASIN B008HUED9O.
Cayley, A. (1889). The Collected Mathematical Papers of Arthur Cayley. (Classic Reprint). 2. Forgotten books. ASIN B008HUED9O.
Crilly, T. (1998). «The young Arthur Cayley». Notes Rec. R. Soc. Lond. (Royal Society) 52 (2): 267–282. doi:10.1098/rsnr.1998.0050.
Crilly, T. (1998). «The young Arthur Cayley». Notes Rec. R. Soc. Lond. (Royal Society) 52 (2): 267–282. doi:10.1098/rsnr.1998.0050.
Curtright, T L; Fairlie, D B; Zachos, C K (2014). «A compact formula for rotations as spin matrix polynomials». SIGMA 10: 084. doi:10.3842/SIGMA.2014.084. Bibcode: 2014SIGMA..10..084C.
Curtright, T L; Fairlie, D B; Zachos, C K (2014). «A compact formula for rotations as spin matrix polynomials». SIGMA 10: 084. doi:10.3842/SIGMA.2014.084. Bibcode: 2014SIGMA..10..084C.
Frobenius, G. (1878). «Ueber lineare Substutionen und bilineare Formen». J.reine angew Math.(Crelle J.) 84: 1–63.
Frobenius, G. (1878). «Ueber lineare Substutionen und bilineare Formen». J.reine angew Math.(Crelle J.) 84: 1–63.
Gantmacher, F.R. (1960). The Theory of Matrices. NY: Chelsea Publishing. ISBN 0-8218-1376-5.
Gantmacher, F.R. (1960). The Theory of Matrices. NY: Chelsea Publishing. ISBN 0-8218-1376-5.
Garrett, Paul B. (2007). Abstract Algebra. NY: Chapman and Hall/CRC. ISBN 1584886897.
Garrett, Paul B. (2007). Abstract Algebra. NY: Chapman and Hall/CRC. ISBN 1584886897.
Hamilton, W. R. (1853). Lectures on Quaternions. Dublin.
Hamilton, W. R. (1853). Lectures on Quaternions. Dublin.
Hamilton, W. R. (1864a). «On a New and General Method of Inverting a Linear and Quaternion Function of a Quaternion». Proceedings of the Royal Irish Academy (Royal Irish Academy) viii: 182–183.
Hamilton, W. R. (1864a). «On a New and General Method of Inverting a Linear and Quaternion Function of a Quaternion». Proceedings of the Royal Irish Academy (Royal Irish Academy) viii: 182–183. (communicated on June 9, 1862)
Hamilton, W. R. (1864b). «On the Existence of a Symbolic and Biquadratic Equation, which is satisfied by the Symbol of Linear Operation in Quaternions». Proceedings of the Royal Irish Academy (Royal Irish Academy) viii: 190–101.
Hamilton, W. R. (1864b). «On the Existence of a Symbolic and Biquadratic Equation, which is satisfied by the Symbol of Linear Operation in Quaternions». Proceedings of the Royal Irish Academy (Royal Irish Academy) viii: 190–101.(communicated on June 23, 1862)
Hou, S. H. (1998). «Classroom Note: A Simple Proof of the Leverrier--Faddeev Characteristic Polynomial Algorithm». SIAM review (SIAM) 40(3): 706-709. doi:10.1137/S003614459732076X.
Hou, S. H. (1998). «Classroom Note: A Simple Proof of the Leverrier--Faddeev Characteristic Polynomial Algorithm». SIAM review (SIAM) 40(3): 706-709. doi:10.1137/S003614459732076X. "Classroom Note: A Simple Proof of the Leverrier--Faddeev Characteristic Polynomial Algorithm"
Hamilton, W. R. (1862). «On the Existence of a Symbolic and Biquadratic Equation which is satisfied by the Symbol of Linear or Distributive Operation on a Quaternion». The London, Edinburgh and Dublin Philosophical Magazine and Journal of Science. series iv (Taylor & Francis) 24: 127–128. ISSN 1478-6435. Ανακτήθηκε στις 2015-02-14.
Hamilton, W. R. (1862). «On the Existence of a Symbolic and Biquadratic Equation which is satisfied by the Symbol of Linear or Distributive Operation on a Quaternion». The London, Edinburgh and Dublin Philosophical Magazine and Journal of Science. series iv (Taylor & Francis) 24: 127–128. ISSN 1478-6435. Ανακτήθηκε στις 2015-02-14.
Householder, Alston S. (2006). The Theory of Matrices in Numerical Analysis. Dover Books on Mathematics. ISBN 0486449726.
Householder, Alston S. (2006). The Theory of Matrices in Numerical Analysis. Dover Books on Mathematics. ISBN 0486449726.
Laufer, A. (1997). «The exponential map of GL(N)». J. Phys. A: Math. Gen. (IOPScience) 30 (15): 5455–5470. doi:10.1088/0305-4470/30/15/029. Bibcode: 1997JPhA...30.5455L.
Laufer, A. (1997). «The exponential map of GL(N)». J. Phys. A: Math. Gen. (IOPScience) 30 (15): 5455–5470. doi:10.1088/0305-4470/30/15/029. Bibcode: 1997JPhA...30.5455L.
Tian, Y. (2000). «Matrix representations of octonions and their application». Advances in Applied Clifford Algebras (Birkhäuser-Verlag) 10 (1): 61–90. doi:10.1007/BF03042010. ISSN 0188-7009.
Tian, Y. (2000). «Matrix representations of octonions and their application». Advances in Applied Clifford Algebras (Birkhäuser-Verlag) 10 (1): 61–90. doi:10.1007/BF03042010. ISSN 0188-7009.
Zeni, J. R.; Rodrigues, W.A. (1992). «A thoughful study of Lorentz transformations by Clifford algebras». Int. J. Mod. Phys. A (World Scientific) 7 (8): 1793 pp. doi:10.1142/S0217751X92000776. Bibcode: 1992IJMPA...7.1793Z.
Zeni, J. R.; Rodrigues, W.A. (1992). «A thoughful study of Lorentz transformations by Clifford algebras». Int. J. Mod. Phys. A (World Scientific) 7 (8): 1793 pp. doi:10.1142/S0217751X92000776. Bibcode: 1992IJMPA...7.1793Z.
Zhang, F. (1997). «Quaternions and matrices of quaternions». Linear Algebra and its Applications (Elsevier) 251: 21–57. doi:10.1016/0024-3795(95)00543-9. ISSN 0024-3795none
Zhang, F. (1997). «Quaternions and matrices of quaternions». Linear Algebra and its Applications (Elsevier) 251: 21–57. doi:10.1016/0024-3795(95)00543-9. ISSN 0024-3795none (open archive).

Εξωτερικοί σύνδεσμοι

Hazewinkel, Michiel, επιμ.. (2001), «Cayley–Hamilton theorem», Encyclopedia of Mathematics, Springer, ISBN 978-1-55608-010-4
Μια απόδειξη από PlanetMath.
Το θεώρημα Cayley–Hamilton στο MathPages
Εφαρμογή που υπολογίζει το χαρακτηριστικό πολυώνυμο ενός Πίνακα (Matrix Calculator).

Εγκυκλοπαίδεια Μαθηματικών

Κόσμος

Αλφαβητικός κατάλογος

Hellenica World - Scientific Library

Από τη ελληνική Βικιπαίδεια http://el.wikipedia.org . Όλα τα κείμενα είναι διαθέσιμα υπό την GNU Free Documentation License