Ableitung einer Matrix mit Parametern

Neue Frage »

Romaxx Auf diesen Beitrag antworten »
Ableitung einer Matrix mit Parametern
Hallo zusammen,

ich habe folgenden Ausdruck:

,

mit

und .

Dabei ist eine Matrix der Dimension und eine Matrix der Dimension .

Nun soll folgendes gelten:



Ich kenne folgende Formeln, wobei ein Parameter in der Matrix ist:

,



Ich komme damit auf:

,

Ich weiß hier bereits nicht, ob die Ableitung passt.
Ich habe nämlich verschiedene Fälle von Matrizen und in Matlab meine Ableitung mit dem was herauskommen soll getestet und komme nicht auf dasselbe Ergebnis. Es scheint als hätte ich bereits hier Faktoren wie oder vergessen, wenn ich beide numerisch vergleiche (durcheinander teile und herumspiele).
Ich brauche keinen genauen Beweis. ich möchte es lediglich nachvollziehen können, ob das so stimmt.

Danke
Romaxx Auf diesen Beitrag antworten »

Hallo,

also es scheint als hätte ich doch alles richtig gemacht. Habe in Matlab etwas Falsches eingegeben.

Danke für das Nachdenken!

Roman
Romaxx Auf diesen Beitrag antworten »

Hallo,

eine Frage hätte ich da noch.

Um mit allgemeinen zurecht zu kommen, wird folgendes vorgeschlagen.

Man soll zuerst nach ableiten, denn dazu gibt es eine Formel:



Diese Formel soll ich nun mit mit der Kettenregel verbinden.

Wie sieht das für den oben einfachen Fall aus, dass ?
Mir ist hier nicht ganz klar, wie man auf eine einfache Matrixmultiplikation von von rechts kommt, wenn man die Kettenregel wie gerade eben erwähnt anwendet.
Scheint trivial, ich sehe es aber nicht.
Romaxx Auf diesen Beitrag antworten »

Hallo,

wer den genauen Wortlaut sehen möchte, kann dies unter:

https://www.google.de/url?sa=t&source=we...aIxu5n1iTux-0mw

Seite 1791 und Seite 1788

Grüße
Ehos Auf diesen Beitrag antworten »

Du wolltest wissen, wie man die Ableitung berechnet, wobei L der Ausdruck (6) in deinem Artikel ist. Dieser Ausdruck bezeichnet den ganz normalen Gradienten der skalaren Funktion L. So steht es jedenfalls in deinem Artikel im Kapitel 2.3. unterhalb der Formel (6):

<Zitat> "The gradient of (6) with respect to X may be found as..."

Im Kapitel "2.3. Probabilistic PCA..." deines Artikels steht nämlich, dass ein normaler Vektor ist (keine Matrix, wie du in deinem 1.Beitrag geschrieben hast). Gesucht ist also nicht die Ableitung nach einem Matrixelement.
Romaxx Auf diesen Beitrag antworten »

Hallo Ehos,

danke für deinen Beitrag.

Zitat:
Du wolltest wissen, wie man die Ableitung berechnet, wobei L der Ausdruck (6) in deinem Artikel ist. Dieser Ausdruck bezeichnet den ganz normalen Gradienten der skalaren Funktion L. So steht es jedenfalls in deinem Artikel im Kapitel 2.3. unterhalb der Formel (6):


In dem Artikel wird von Mehrzahl 'gradients' gesprochen. Es handelt sich bei um mehrere Gradienten.

Zitat:
Im Kapitel "2.3. Probabilistic PCA..." deines Artikels steht nämlich, dass ein normaler Vektor ist (keine Matrix, wie du in deinem 1.Beitrag geschrieben hast). Gesucht ist also nicht die Ableitung nach einem Matrixelement.


Wenn du weiter liest findest du .
Das unterscheidet sich zwar zu meinem ersten Post:

Zitat:
und .Dabei ist eine Matrix der Dimension und eine Matrix der Dimension .


Hier habe ich mich noch nicht strikt an die Notation im Artikel gehalten, da dies meiner Meinung nach für das Problem keine Rolle spielt (kann mich auch Irren, bin mir aber sehr sicher eigentlich). Hier könnte auch das sein und anders herum. Um weiter Verwirrung zu umgehen, richte ich meine Notation nun an dem Artikel aus.
Den Sachverhalt als einzelne partielle Ableitungen nach zu verstehen ist meiner Meinung nach immer noch richtig.

Grüße
 
 
Ehos Auf diesen Beitrag antworten »

Du hast recht. In dem zitierten Artikel wird die "Matrix-Ableitung" des folgenden Terms berechnet



Abkürzung:



Da der 1.Summand von L konstant ist, sind müssen nur der 2. und 3.Summand berechnet werden.

----------------------------------------------------------------------
2.Summand:
Hierfür benutze folgende Regel, die du selbst bereits genannt hast



Diese Regel kann man übrigens leicht herleiten, wenn man alles in demjenigen Koordinatensystem betrachtet, worin die Matrix K diagonal ist.
----------------------------------------------------------------------
3.Summand:
Betrachte alles in in demjenigen Koordinatensystem, worin die symmetrische Matrix diagonal ist, also . Dann sind und ebenfalls diagonal




Für die Matrixspur bekommt man



Weil darin nur die Größe von abhängt, erhält man mittels Quotientenregel für die Ableitung der Matrixspur



Versuche, das noch zu vereinfachen.
Romaxx Auf diesen Beitrag antworten »

Hallo Ehos,

danke für deinen Beitrag. Die Vorgehensweise ist interessant.

Du scheinst mit solchen Rechnungen Erfahrungen zu haben. Kannst du mir noch die Vorgehensweise in meinem dritten Post erläutern? Mir ist nicht klar, wie man auch eine einfache Multiplikation von X von links kommt. (Kettenregel anwenden etc.)

Hast du mir zu solchen Ableitungen eine gute Literatur?

Grüße
Ehos Auf diesen Beitrag antworten »

Die letzten Zeile meines Posts vom 18.08.18 muss irgendwie einen Ausdruck ergeben, worin die Matrix X vorkommt ohne Tr(...). Wie das geht, ist mir auch noch nicht klar.
Romaxx Auf diesen Beitrag antworten »

Hallo Ehos,

ja, das man auf ein X kommen muss ja, die Vorgehensweise mit der Kettenregel ist für mich aber ominös. Denn dann müsste sein.

Das macht aber für mich keinen Sinn.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »