Ableitung einer Matrix mit Parametern |
15.08.2016, 14:21 | Romaxx | Auf diesen Beitrag antworten » | ||||||
Ableitung einer Matrix mit Parametern ich habe folgenden Ausdruck: , mit und . Dabei ist eine Matrix der Dimension und eine Matrix der Dimension . Nun soll folgendes gelten: Ich kenne folgende Formeln, wobei ein Parameter in der Matrix ist: , Ich komme damit auf: , Ich weiß hier bereits nicht, ob die Ableitung passt. Ich habe nämlich verschiedene Fälle von Matrizen und in Matlab meine Ableitung mit dem was herauskommen soll getestet und komme nicht auf dasselbe Ergebnis. Es scheint als hätte ich bereits hier Faktoren wie oder vergessen, wenn ich beide numerisch vergleiche (durcheinander teile und herumspiele). Ich brauche keinen genauen Beweis. ich möchte es lediglich nachvollziehen können, ob das so stimmt. Danke |
||||||||
15.08.2016, 15:11 | Romaxx | Auf diesen Beitrag antworten » | ||||||
Hallo, also es scheint als hätte ich doch alles richtig gemacht. Habe in Matlab etwas Falsches eingegeben. Danke für das Nachdenken! Roman |
||||||||
15.08.2016, 15:31 | Romaxx | Auf diesen Beitrag antworten » | ||||||
Hallo, eine Frage hätte ich da noch. Um mit allgemeinen zurecht zu kommen, wird folgendes vorgeschlagen. Man soll zuerst nach ableiten, denn dazu gibt es eine Formel: Diese Formel soll ich nun mit mit der Kettenregel verbinden. Wie sieht das für den oben einfachen Fall aus, dass ? Mir ist hier nicht ganz klar, wie man auf eine einfache Matrixmultiplikation von von rechts kommt, wenn man die Kettenregel wie gerade eben erwähnt anwendet. Scheint trivial, ich sehe es aber nicht. |
||||||||
15.08.2016, 21:17 | Romaxx | Auf diesen Beitrag antworten » | ||||||
Hallo, wer den genauen Wortlaut sehen möchte, kann dies unter: https://www.google.de/url?sa=t&source=we...aIxu5n1iTux-0mw Seite 1791 und Seite 1788 Grüße |
||||||||
17.08.2016, 09:59 | Ehos | Auf diesen Beitrag antworten » | ||||||
Du wolltest wissen, wie man die Ableitung berechnet, wobei L der Ausdruck (6) in deinem Artikel ist. Dieser Ausdruck bezeichnet den ganz normalen Gradienten der skalaren Funktion L. So steht es jedenfalls in deinem Artikel im Kapitel 2.3. unterhalb der Formel (6): <Zitat> "The gradient of (6) with respect to X may be found as..." Im Kapitel "2.3. Probabilistic PCA..." deines Artikels steht nämlich, dass ein normaler Vektor ist (keine Matrix, wie du in deinem 1.Beitrag geschrieben hast). Gesucht ist also nicht die Ableitung nach einem Matrixelement. |
||||||||
17.08.2016, 13:24 | Romaxx | Auf diesen Beitrag antworten » | ||||||
Hallo Ehos, danke für deinen Beitrag.
In dem Artikel wird von Mehrzahl 'gradients' gesprochen. Es handelt sich bei um mehrere Gradienten.
Wenn du weiter liest findest du . Das unterscheidet sich zwar zu meinem ersten Post:
Hier habe ich mich noch nicht strikt an die Notation im Artikel gehalten, da dies meiner Meinung nach für das Problem keine Rolle spielt (kann mich auch Irren, bin mir aber sehr sicher eigentlich). Hier könnte auch das sein und anders herum. Um weiter Verwirrung zu umgehen, richte ich meine Notation nun an dem Artikel aus. Den Sachverhalt als einzelne partielle Ableitungen nach zu verstehen ist meiner Meinung nach immer noch richtig. Grüße |
||||||||
Anzeige | ||||||||
|
||||||||
18.08.2016, 13:35 | Ehos | Auf diesen Beitrag antworten » | ||||||
Du hast recht. In dem zitierten Artikel wird die "Matrix-Ableitung" des folgenden Terms berechnet Abkürzung: Da der 1.Summand von L konstant ist, sind müssen nur der 2. und 3.Summand berechnet werden. ---------------------------------------------------------------------- 2.Summand: Hierfür benutze folgende Regel, die du selbst bereits genannt hast Diese Regel kann man übrigens leicht herleiten, wenn man alles in demjenigen Koordinatensystem betrachtet, worin die Matrix K diagonal ist. ---------------------------------------------------------------------- 3.Summand: Betrachte alles in in demjenigen Koordinatensystem, worin die symmetrische Matrix diagonal ist, also . Dann sind und ebenfalls diagonal Für die Matrixspur bekommt man Weil darin nur die Größe von abhängt, erhält man mittels Quotientenregel für die Ableitung der Matrixspur Versuche, das noch zu vereinfachen. |
||||||||
18.08.2016, 14:42 | Romaxx | Auf diesen Beitrag antworten » | ||||||
Hallo Ehos, danke für deinen Beitrag. Die Vorgehensweise ist interessant. Du scheinst mit solchen Rechnungen Erfahrungen zu haben. Kannst du mir noch die Vorgehensweise in meinem dritten Post erläutern? Mir ist nicht klar, wie man auch eine einfache Multiplikation von X von links kommt. (Kettenregel anwenden etc.) Hast du mir zu solchen Ableitungen eine gute Literatur? Grüße |
||||||||
19.08.2016, 11:43 | Ehos | Auf diesen Beitrag antworten » | ||||||
Die letzten Zeile meines Posts vom 18.08.18 muss irgendwie einen Ausdruck ergeben, worin die Matrix X vorkommt ohne Tr(...). Wie das geht, ist mir auch noch nicht klar. |
||||||||
19.08.2016, 12:58 | Romaxx | Auf diesen Beitrag antworten » | ||||||
Hallo Ehos, ja, das man auf ein X kommen muss ja, die Vorgehensweise mit der Kettenregel ist für mich aber ominös. Denn dann müsste sein. Das macht aber für mich keinen Sinn. |
|
Verwandte Themen
Die Beliebtesten » |
|
Die Größten » |
|
Die Neuesten » |
|