Empirische Risikofunktion mit Regularisierungsterm ableiten+minimieren |
| 01.11.2020, 15:37 | mrclndr | Auf diesen Beitrag antworten » |
| Empirische Risikofunktion mit Regularisierungsterm ableiten+minimieren habe ein Problem bei der folgenden Aufgabenstellung; es wird wohl irgendwo an der Matrizenrechnung scheitern (war jetzt nicht sicher, ob das unter Algebra, Analysis oder Sonstiges fällt; ggf. gerne verschieben). Ich soll die folgende Funktion nach dem Vektor optimieren (x von derselben Dimension wie w, y ein reeller Skalar), genauer einen optimalen Gewichtsvektor w* finden, der die Funktion minimiert: Das ist die empirical loss function für die lineare Regression, wie sie in der Volesung notiert ist, plus einem Regularisierungsterm (ridge/Tikhonov). Das ist einmal soweit mein Rechenweg -- erstmal je Term, also zunächst die loss function: Soweit hatten wir es auch in unserer Vorlesung (nur dass der Bruch, da Ableitung 0 gesetzt, wegfiel, was jetzt ja wegen dem zweiten Term erstmal nicht zulässig ist). Zweiter Term, die L2^2-Norm: Ich hätte es selber auch nicht hingekriegt, aber im Internet habe ich gefunden, dass diese abgeleitet inkl. dem gegebenen Skalar ergibt. Ergibt gesamt als Minimierungsproblem nach w: Und da scheitere ich jetzt: Ich stelle erst einmal so um, dass ich den Regularisierungsterm auf beiden Seiten subtrahiere. Dann multipliziere ich beide Seiten mit m/2. Als Zwischenergebnis also: Ich subtrahiere dann noch das Produkt von Summe und w^T von beiden Seiten, sodass alle w oder w^T auf einer Seite sind: Dann weiß ich aber nicht mehr weiter. Ich würde natürlich gerne das w herausheben, weiß aber nicht, ob/wie das geht, wenn es einmal nicht transponiert und einmal transponiert vorhanden ist. Im Grunde hätte ich einfach gerne ein w anstelle eines w und eines w_T und weiß nicht, wie ich das erzeuge. Das Ergebnis soll laut Lehrbuch so aussehen, mit und : Aber in meiner Aufgabenstellung muss ich das erst in einem zweiten Schritt mit den Matrizen darstellen (dann eben noch entsprechend zurückstellen, sodass w wieder isoliert ist). Es wäre toll, wenn mir jemand hierbei Tipps geben könnte. Was ich im Internet finde, ist mir gerade einfach zu hoch bzw. überspringt zu viele Schritte. Vielen Dank! |
||
|
|
Verwandte Themen
| Die Beliebtesten » |
|
| Die Größten » |
|
| Die Neuesten » |
|
