Wieso diagonalisiert man die Kovarianzmatrix bei der Hauptkomponentenanalyse?

Neue Frage »

planlos66 Auf diesen Beitrag antworten »
Wieso diagonalisiert man die Kovarianzmatrix bei der Hauptkomponentenanalyse?
Meine Frage:
Ich beschäftige mich zur Zeit mit Hauptkomponentenanalyse.
Ziel ist es ja, durch eine geeignete Hauptachsentransformation für die Kovarianzmatrix die Varianz der ersten paar Vektorkomponenten zu maximieren.
Man ließt nun in entsprechenden Büchern immer, dass sich dies durch Diagonalisierung der Kovarianzmatrix erreichen lässt - mir ist aber rätselhaft, wieso dies gerade so funktioniert.
Klar ist, dass sich die Varianz/die Diagonaleinträge der Matrix durch einen Basiswechsel ändern. Wieso wird sie aber in den ersten Komponenten ausgerechnet dann maximal, wenn man diagonalisiert?

Meine Ideen:
Siehe Frage
Captain Kirk Auf diesen Beitrag antworten »

Hallo,

die Eigenwerte in der Diagonale werden der Größe nach sortiert.
Daher wegibt sich in der ersten Komponente die maximale Skalierung.
donot Auf diesen Beitrag antworten »

Naja, dann könnte man sich das Diagonalisieren ja auch sparen und einfach die Diagonaleinträge der Ausgangsmatrix der Größe nach sortieren.
Captain Kirk Auf diesen Beitrag antworten »

@donot: Ja könnte man machen, ist aber ziemlich sinnfrei und hat nichts mit Maximalität zu tun.

Bist du der Fragensteller?
donot Auf diesen Beitrag antworten »

Bin ich^^ Danke für deine Antworten, ich steh leider immer noch auf dem Schlauch:

Wieso? Ich meine, erklärtes Ziel ist es doch, die Varianz in den ersten Komponenten zu maximieren (siehe z.B. hier: http://de.wikipedia.org/wiki/Hauptkomponentenanalyse#Maximierung_der_Varianz )
Dazu kann ich einfach durch eine Achsenvertauschung die größten Varianzen auf der Diagonalen nach links oben sortieren. Eine Diagonalisierung brauche ich dazu nicht.
Captain Kirk Auf diesen Beitrag antworten »

Zitat:
Dazu kann ich einfach durch eine Achsenvertauschung die größten Varianzen auf der Diagonalen nach links oben sortieren

Und genau das macht doch das Diagonalisieren.

Ich vermute dein Verständnisproblem liegt eigentlich beim Diagonaliseren.
Was macht man anschaulich dabei?
Man baut sich ein Koordinatensystem so , dass die Matrix/Abbildung auf den Achsen nur eine Streckung/Skalierung ist.
Auf dem Basiselement/"Achse" mit dem größten Eigenwert ergibt sich die generell maximale Streckung.
Auf den fall hier übertragen: Die maximale Varianz.
 
 
donot Auf diesen Beitrag antworten »

OK, ich glaube ich bekomme so langsam eine Idee davon, was du meinst.
Ich fasse mal zusammen:
  • Wir haben eine beliebige symmetrische positiv definite Matrix
  • Wir wollen einen (orthogonalen) Basiswechsel finden, sodass einer der Diagonaleinträge der Matrix größer/gleich wird als alle Diagonaleinträge in allen anderen möglichen Basen ("Varianz der ersten Komponenten maximieren")

Stimmst du mir bis hierhin zu?

Du sagst nun, man will herausfinden in welcher Basis die Abbildung die erste Koordinatenachse/Basiskomponente am meisten gestreckt wird, da stimme ich dir zu.
Dies ist deiner Aussage nach ist das der Fall in der Eigenbasis.
Und deine Erklärung ergibt anschaulich für mich etwas Sinn, auch wenn ich mir noch nicht ganz sicher bin ob ich mir das wirklich vorstellen kann....

Könnte man das nicht irgendwie formalisieren/beweisen?
Also, dass es nicht einen anderen Basiswechsel als "Diagonalisieren" geben kann, bei den der größte Diagonaleintrag noch größer als ist als alle Diagonaleinträge in der Matrix in Diagonalform?
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »