Was ist die Idee einer Ableitung?

Neue Frage »

system-agent Auf diesen Beitrag antworten »
Was ist die Idee einer Ableitung?
Nehmen wir eine Funktion . Stellen wir uns vor, dass schrecklich kompliziert ist. Nun aus irgendeinem Grund interessieren wir uns für eine gewisse Stelle und den zugehörigen Funktionswert . Den Funktionswert kann man bekanntlich [mehr oder weniger] einfach auswerten: man setzt die Stelle in die Funktionsvorschrift von ein.

Was passiert nun wenn wir "an ein bischen wackeln" ? Das heisst: Was passiert mit den Funktionswerten wenn wir an einer Stelle ganz nahe an schauen?
Und genau das ist die Frage der Differentialrechnung !

Aber wie fasst man nun dieses "wackeln" mathematisch?

Nehmen wir eine Zahl die sehr klein sein soll. Wir wollen also betrachten. Die Idee ist nun, dass man für "anständige" Funktionen diese für genügend kleine Abweichungen von unserer Stelle mit einer sehr einfachen Funktion gut annähern kann, nämlich mit einer Geraden.

Um nun diese Gerade festzulegen schauen wir uns ihre allgemeine Gleichung an:

wobei die Steigung der Geraden ist und die Skalierung mit und bewirkt, dass die Gerade tatsächlich durch den Punkt geht.
Natürlich, sofern man diese Tangente angeben kann [für eine gewisse Steigung ], dann hat man eine gute Annäherung an unsere Funktion gefunden, in der Nähe von . Den Fehler den man macht bezeichne ich hier mit . Die Indizes und sollen daran erinnern dass wir die Funktion an der Stelle annähern wollen und der Rest hängt sicherlich von ab, also wie weit wir von unserer Stelle weggehen.

Sofern alles gut geht, das heisst wir können eine solche eindeutige Tangente finden, die auch wirklich unsere Funktion annähert, dann können wir

schreiben [hier wurde durch die Stelle ersetzt an der wir uns befinden, nämlich ]. Das heisst die ersten beiden Summanden sind die von unserer Tangente und der Restterm gleicht den Fehler aus den wir machen wenn wir einen Funktionswert mit der Tangente berechnen.
Da das Ganze ein Annäherung sein soll, will man, dass

gilt. Das bedeutet je näher wir unserem Referenzpunkt kommen, desto besser ist die Annäherung durch die Tangente.
system-agent Auf diesen Beitrag antworten »
Wo liegt nun das Problem?
Das Problem ist, dass wir vorhin angenommen haben, dass eine Funktion genügend "anständig" ist. Das bedeutet, wir wollen eine eindeutige Annäherungstangente finden können [Gegenbeispiel dazu ist die Betragsfunktion; diese macht einen "Knick" in und dort kann man keine eindeutige Tangente finden; siehe den Plot] so, dass der Restterm auch wirklich klein ist wenn das Wackeln klein ist.



Nun für welche Funktionen geht alles gut? Drehen wir den Spiess einfach um nennen eine Funktion differenzierbar in einem Punkt ihres Definitionsbereiches WENN alles gut geht. Jetzt also die formale Definiton:

Zitat:
Sei ein offenes Intervall, ein Punkt und eine Funktion.
heisst differenzierbar in genau dann, wenn es eine lineare Funktion und eine in einer Umgebung von definierten Funktion gibt derart, dass gilt



mit .


Manchmal sagt man zu (*) auch eine "Dreigliedentwicklung" von (in ).
Das heisst wir nennen jede Funktion in differenzierbar wenn das obige gilt.
Weiter nennen wir die lineare Abbildung das Differential von im Punkt und bezeichnen es mit .
system-agent Auf diesen Beitrag antworten »
Beispiel
Machen wir ein Beispiel:
Nehmen wir definiert durch .

Wählen wir den Punkt . Machen wir einfach einmal eine Dreigliedentwicklung:

wobei
,
ist die lineare Abbildung [also die konstante Abbildung Null] und
.

Damit differenzierbar in sein kann müssen wir noch überprüfen ob der Rest klein ist:

Also ist in differenzierbar und das Differential von ist .

Oder mit :
Wieder eine Dreigliedentwicklung machen:

wobei
,
ist die lineare Abbildung und
.
Von oben wissen wir, dass der Restterm klein in ist und damit ist auch differenzierbar in .

Für einen allgemeinen Punkt gilt:

wobei
,
ist die lineare Abbildung und

und von Vorherigem ist der Restterm wieder klein in .

Damit ist differenzierbar auf ganz , mit Differential .
system-agent Auf diesen Beitrag antworten »
Ist das Differential eindeutig?
Tatsächlich ist das Differential [also die lineare Abbildung die annähert] einer differenzierbaren Abbildung auch eindeutig.
Das sieht man so:
Seien und lineare Abbildungen mit der geforderten Eigenschaft der Definition. Dann hat man Dreigliedentwicklungen:

mit der zu gehörige Restterm und

mit der zu gehörige Restterm.

Es folgt also

oder


und sind lineare Abbildungen, also gilt und ähnlich . Wir bekommen


Dividiere durch [natürlich nur für ]:


Wegen

folgt also und damit sind und identisch [da für alle ].

Das bedeutet es gibt für jeden Punkt einer differenzierbaren Funktion höchstens ein Differential und die Schreibweise ist gerechtfertigt.
system-agent Auf diesen Beitrag antworten »
Wieso ist die obige Definition gleich mit der, die ich kenne?
Hier wurde definiert:
heisst differenzierbar in falls es eine lineare Abbildung gibt so, dass

mit
.

Schreiben wir das ein bischen um:

Division durch gibt


Nutze nun nochmal die Linearität von :


Also kriegen wir


Nun nehmen wir :
.

Das bedeutet der Grenzwert auf der linken Seite existiert und das ist genau die bekanntere Definition der Differenzierbarkeit !
system-agent Auf diesen Beitrag antworten »
Wieso nochmal eine Defintion?
Die Antwort darauf ist ganz einfach: Mit der nicht so bekannten Definition lässt sich die Differenzierbarkeit sofort verallgemeinern! Augenzwinkern
 
 
system-agent Auf diesen Beitrag antworten »
Wie sieht es also in mehreren Dimensionen aus?
Nehmen wir eine offene Menge , ein Punkt und eine Funktion.
Nun auch für solch eine Funktion kann man auf die Idee kommen, dass man sie annähern will durch etwas lineares [falls , dann bekommt man eine "Tangentialebene"] und die Idee überträgt sich wirklich genau auf diesen Fall. Nun zunächst die Definiton.
Für diesen Fall braucht man zuerst noch eine Norm auf .

Zitat:
Sei offen, ein Punkt und eine Funktion.
heisst differenzierbar in genau dann, wenn es eine lineare Abbildung gibt und eine in einer Umgebung von definierte Funktion derart, dass

mit

Die lineare Abbildung heisst Differential von im Punkt und wird geschrieben als .
system-agent Auf diesen Beitrag antworten »
Gilt die Eindeutigkeit des Differentials?
Hier ist ebenfalls das Differential eindeutig bestimmt.
Nehmen wir wie zuvor zwei lineare Abbildungen mit

und

wobei den Restterm von und den Restterm von bezeichnet.

Man bekommt wie zuvor


Nutze nun die Linearität von und den speziellen Vektor mit klein und der i-te Basisvektor.
Dann gilt

und ähnlich für .

Wir bekommen


Dividiere durch [das ist möglich, da !]:

Nehme nun und man bekommt , das heisst dass und auf allen Basisvektoren gleich sind und wegen der Linearität auch auf dem ganzen Raum.
system-agent Auf diesen Beitrag antworten »
Beispiel
Nun ein Beispiel:

Nehmen wir definiert durch . Nehmen wir den Punkt . Nun eine Dreigliedentwicklung mit :


wobei
,
[hier ist die Transponierte] und
.

Wir müssen noch überprüfen, dass der Rest klein in ist (zb. mit der euklidischen Norm):


Damit ist in differenzierbar mit Differential .
Das bedeutet geometrisch, dass die Tangentialebene die Gleichung

oder

erfüllt.


Noch ein Beispiel:
Nehmen wir ein Skalarprodukt . Fixieren wir und schauen wir uns die Abbildung

an. Machen wir eine Dreigliedentwicklung

wobei
,
und
also die konstante Abbildung Null.

Hier müssen wir demnach garnichts überprüfen was den Restterm angeht und die Funktion ist daher differenzierbar auf . Das Differential ist sicher linear in , da das Skalarprodukt nach Definition bilinear ist.


Eine kleine Abwandlung des vorherigen Beispiels ist Folgendes:
Sei irgendein Skalarprodukt auf . Dieses Skalarprodukt liefert eine Norm durch die Definition .
Betrachten wir also nun diese Normfunktion, das heisst die Funktion definiert durch .
Diese Funktion ist an jeder Stelle differenzierbar. Wieso?

Machen wir dazu für eine Dreigliedentwicklung:
,
wobei wir die Bilinearität eines Skalarprodukts verwandt haben und die Festlegungen sowie .

Aus der Bilinearität des Skalarprodukts bekommen wir insbesondere, dass die Abbildung tatsächlich linear ist und auch der Rest ist klein in , denn
.

Damit haben wir bewiesen, dass die Funktion überall auf differenzierbar ist bezüglich des gewählten Skalarprodukts und der zugehörigen Norm .
Es ist aber ein bekannter Satz der Analysis, dass auf einem endlichdimensionalen reellen Vektorraum alle Normen äquivalent sind. Mit diesen Satz folgt, dass die Funktion aber auch bezüglich jeder anderen Norm differenzierbar ist (also zum Beispiel auch bezüglich der euklidischen Norm, die vom allseits bekannten euklidischen Standardskalarprodukt kommt).

Übrigens, mithilfe der Kettenregel bekommen wir auch gleich noch, dass die Zuordnung differenzierbar ist. Das heisst die Norm selbst - die ja auch nur eine Funktion ist - ist bereits differenzierbar.
system-agent Auf diesen Beitrag antworten »
Wo sind die partiellen Ableitungen hin?
Die partiellen Ableitungen verstecken sich im Differential .

Erinnern wir uns, dass das Differential eine lineare Abbildung ist. Berechnen wir nun einmal das Bild des ersten Basisvektors.
Dazu wieder die Definition:


Setzen wir nun ein mit klein genug. Wir erhalten


Nutzen wir die Linearität des Differentials:

und wir bekommen


Nun dividieren wir wieder durch und nehmen wir wieder :


Wir sehen, dass dies genau die Defintion der partiellen Ableitung ist:


Damit kann man das Differential endlich auch als Matrix schreiben; wir erhalten:

und das kennen viele Leute als den "Gradienten".

Allgemeiner ist für ein gerade die Richtungsableitung von in der Richtung von und man bekommt wenn man ausschreibt:


und manche Leute schreiben das mit dem Standardskalarprodukt:



Ich möchte an dieser Stelle noch auf etwas hinweisen:
In der ganzen Diskussion habe ich niemals eine spezielle Norm oder Basis vom genutzt. Alle diese Definitionen sind Basisunabhängig ! Insbesondere ist der Gradient, so wie ihn die Leute normalerweise definieren mit lästigen Standardkoordinaten behaftet, das heisst der Standardbasis.

Eine weitere Bemerkung ist ein Ausblick:
Wir haben gesehen, dass man pro Punkt einer differenzierbaren Funktion eine lineare Abbildung bekommt.
Formal gesehen hat man eine Abbildung

definiert durch


Hier notiert den Dualraum vom -Vektorraum und dieser ist definiert als die Menge aller linearen Abbildungen nach :

und selbst ein -Vektorraum.

Diese Abbildung heisst eine 1-Differentialform oder kurz eine 1-Form.
Beachte, dass diese 1-Form überhaupt nicht linear ist. Trotzdem bezeichnet man die 1-Form, definiert durch oft ebenfalls als (totales) Differential von der Funktion und schreibt auch anstelle von .
Das kann leicht zu Verwirrung führen.

Weiter kann man mithilfe von diesem auch erklären was die zweite Ableitung sein soll. Die zweite Ableitung der Funktion ist dann genau das Differential der 1-Form , also der lineare Anteil in der Dreigliedentwicklung und dieses Differential ist eine Abbildung , also pro Punkt eine lineare Abbildung .
Man kann identifizieren mit dem Vektorraum aller bilinearen Abbildungen auf mit Werten in und das heisst die zweite Ableitung ist eine Abbildung, die pro Punkt eine bilineare Abbildung liefert. Schreibt man das auf, dann stösst man auf die Hessesche Form, die in Koordinaten gerade die bekannte Hesse-Matrix liefert.
system-agent Auf diesen Beitrag antworten »
Kann man noch allgemeiner ein Differential definieren?
Die Definition der Differenzierbarkeit kann man erheblich allgemeiner fassen.
Was haben wir denn bisher von beziehungsweise verwendet um die Differenzierbarkeit zu definieren?

Zunächst hatten wir einen -Vektorraum. In ersten Fall war das gerade selbst und im zweiten Fall .

Um allgemeiner zu werden brauchen wir einfach einen -Vektorraum und wir nehmen an, dass dieser endlichdimensional ist, also zum Beispiel .

Weiter haben wir im ersten Fall ein offenes Intervall und im zweiten Fall einfach eine offene Menge genutzt. In der Definition kamen zusätzlich noch Normen vor.
Also nehmen wir an, dass unser -Vektorraum auch normiert ist, also eine Norm besitzt.
Die Norm haben wir gebraucht, um die Länge von Vektoren messen zu können. Aber mit einer Norm hat man sofort auch offene Mengen auf [offene Kugeln].

Nun zuerst die Definition:
Zitat:
Seien und endlichdimensionale -Vektorräume die jeweils mit einer Norm bzw. ausgestattet sind.
Sei eine offene Menge, ein Punkt und eine Abbildung.
heisst differenzierbar in genau dann, wenn es eine lineare Abbildung und eine in einer Umgebung von definierte Abbildung gibt so, dass für alle mit genügend klein [das bedeutet so, dass liegt] gilt:


sowie
.


Die lineare Abbildung heisst dann auch Differential von im Punkt und wird mit bezeichnet.

Auch in diesem Fall ist das Differential wieder eindeutig und der Beweis dafür geht ganz genauso wie in den anderen beiden Fällen.
Man sollte auch noch bemerken, dass diese Definition wieder Koordinatenfrei ist, das heisst man hat nirgends eine Basis ausgezeichnet.

Natürlich ist hier auch der Spezialfall von und enthalten mit jeweils zum Beispiel der euklidischen Norm und der Standardbasis.
Als Differential bekommt man hier das, was unter dem Namen Jacobimatrix bekannt ist [oder je nach Schreibweise der Vektoren als Spalte oder Zeile eben die Transponierte davon].
Manche nennen das auch das totale Differential von der Funktion . Wieder einige Leute bezeichnen eine solche Funktion

als ein Vektorfeld.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »