Optimierung unter Nebenbedingung, Definitheit |
| 06.07.2006, 11:22 | jay-jay | Auf diesen Beitrag antworten » |
| Optimierung unter Nebenbedingung, Definitheit ich bräuchte eure Hilfe bei einer Herleitung, und zwar ist mir nicht klar, warum bei der Bedingung 2. Ordnung die Hesse-Matrix definit sein muss für alle h für die grad g(x) h=0. g(x) ist hier die NB. Danke für eure Hilfe |
||
| 06.07.2006, 13:50 | Abakus | Auf diesen Beitrag antworten » |
| RE: Optimierung unter Nebenbedingung, Definitheit Was sind denn g und h ? Und um welches Problem geht es (was soll optimiert werden) ? Grüße Abakus
|
||
| 06.07.2006, 14:19 | jay-jay | Auf diesen Beitrag antworten » |
Es geht um optimierung von f(x) unter der NB g(x)=0 Lagrange-Verfahren ... Die hinreichende Bedingung zweiter Ordnung für ein globales beschränktes Optimum ist doch dann, dass die Hesse-Matrix, also die zweiten Ableitungen der Lagrange-Funktion nach dem Vektor x positiv bzw negativ definit ist für bestimmte Vektoren h Also: ist die Hesse-Matrix und für , also dem Produkt von dem Gradienten von g(x) und dem Vektor h. Darauf bezieht sich jetzt meine Frage, warum muss die Hesse-Matrix nur für diese h definit sein und wie kann ich das zeigen? |
||
| 06.07.2006, 22:04 | Abakus | Auf diesen Beitrag antworten » |
Du kannst die zweite Ableitung der Lagrange-Funktion ähnlich wie hier angegeben ausrechnen (die Ableitung von y musst du nach der Formel über implizite Funktionen ersetzen). Dann kommst du nach längerer Rechnung auf folgende Darstellung für die 2-te Ableitung (y ist hier implizit von x aufgrund der Nebenbedingung abhängig): Entscheidend für die Konvexität oder Konkavität ist nun lediglich, ob dieser Ausdruck positiv oder negativ ist. Vektoren, die linear von abhängig sind (hier jeweils die 2-te Spalte der beiden Determinanten betrachtet), machen die beiden Determinanten jeweils zu 0. Entscheidend ist für den Wert dieser beiden Determinanten demnach nur die zu orthogonale Komponente (Determinantenrechenregeln), woraus letztlich die von dir angegebene Bedingung resultiert. Grüße Abakus
PS: es mag durchaus sein, dass du eine einfachere Begründung als diese hier findest. EDIT: 1 Gradient zuviel korrigiert |
||
| 08.07.2006, 13:19 | jay-jay | Auf diesen Beitrag antworten » |
Ich kann dir bis hierhin folgen: und daraus dann den Vektor Woher nimmst du denn den Gradienten davor? Und außerdem verstehe ich deine Argumentation nicht, warum grad g deshalb orthogonal zu h sein muss (klar damit grad g * h =0, aber wieso ist dann der Wert der Matrix bestimmt? |
||
| 08.07.2006, 20:04 | Abakus | Auf diesen Beitrag antworten » |
Mal langsam das Ganze und von Vorne (ich brauche das etwas ausführlicher): zu lösen: g definiert nun unter geeigneten Umständen implizit eine Funktion y(x), etwa dann, wenn . Insbesondere lässt sich - nach dem Satz über implizite Funktionen - die Ableitung von y nach x wie folgt schreiben: Demzufolge ist es möglich f nur als Funktion von x zu betrachten, also und stattdessen M zu betrachten. Nun ist: Dies lässt sich nochmals nach x differenzieren, zur Abkürzung lasse ich hier die Argumente jeweils weg: Dieser Ausdruck wird nun vereinfacht: zunächst werden nur die stationären Punkte der Lagrange-Funktion betrachtet (um die geht es uns ja), dafür gilt: . Ferner gilt nach dem Satz v. Schwarz: . Dies eingesetzt und geeignet geklammert ergibt: Dies hast du im Prinzip soweit auch (ich hatte oben einen Gradienten zuviel und es jetzt richtig editiert). Wenn dies nun < 0 ist, ist f ( unter Berücksichtigung der Nebenbedingung betrachtet) konkav und hat ein Maximum, bei > 0 ist f konvex und es liegt ein Minimum vor. Ebenso sehen wir, dass der Term deutlich vom Gradienten von g abhängt. Für die Prüfung auf diese Eigenschaft (konvex, konkav) reicht es nun aus, nur mit zu orthogonalen Vektoren zu prüfen. Dies liegt an folgendem: Sei und die Vektoren und seien orthogonal. Dann gilt: Es reicht demnach aus, nur die orthogonale Komponente zu betrachten. Genau das wird in deinem Satz gemacht. Grüße Abakus
EDIT 1+2: Latex |
||
| Anzeige | ||
|
|
||
| 09.07.2006, 15:13 | jay-jay | Auf diesen Beitrag antworten » |
Danke erstmal bis hierhin. Verstehe ich das so richtig: M''(x) lässt sich doch ausdrücken durch: Der Satz um den es geht sagt jetzt: für alle Vektoren h, die erfüllen, weil
|
||
| 09.07.2006, 18:47 | Abakus | Auf diesen Beitrag antworten » |
So ist es, wobei M''(x) noch einen zusätzlichen Vorfaktor mit bekanntem Vorzeichen besitzt. Grüße Abakus
EDIT: Text |
||
|
|
Verwandte Themen
| Die Beliebtesten » |
|
| Die Größten » |
|
| Die Neuesten » |
|
