Fehlerterme in Regressionsrechnung

Neue Frage »

LollaLolla Auf diesen Beitrag antworten »
Fehlerterme in Regressionsrechnung
Hallo,

warum versucht man in der linearen Regressionsrechnung mit der Ausgleichsgeraden eigentlich immer die Abstände zur Geraden nur in Y-Richtung zu minimieren ?

Wurde das einfach mal festgelegt?

Würde man auf das gleiche Ergebnis kommen, wenn man in X-Richtung minimiert?
Finn_ Auf diesen Beitrag antworten »

Blau minimiert die Quadratesumme der y-Abstände, Grün die der x-Abstände.

[attach]52003[/attach]
LollaLolla Auf diesen Beitrag antworten »

Hallo Finn_ ,

aber warum minimiert man in einer linearen Regression mittels Kleinste Quadrate Schätzung immer die vertikalen Abstände zur Gerade ?

Meine Frage, ob dies zu Unterschieden führen würde, hast du mit deiner Grafik bereits beantwort, danke dafür!
Finn_ Auf diesen Beitrag antworten »

Die mathematische Bestätigung dafür lässt sich erbringen, es ist aber für uns einfacher und anschaulicher, wenn wir dies zunächst simulieren.

Angenommen wir kennen die wahre Gerade, um die die Messwerte herum streuen. Dies sei . An der Stelle ist der Messwert also eine Zufallsgröße . Hierbei ist eine Zufallszahlengenerator, der einer bestimmten Verteilung folgt, im Beispiel benutze ich eine Gleichverteilung, bei Messwerten mag es eine Normalverteilung sein. Formal ist der Zufallszahlengenerator eine Folge von unabhängigen und identisch verteilten Zufallsgrößen.

Die mathematische Statistik baut auf der Wahrscheinlichkeitstheorie auf und definiert bzw. sucht sogenannte Schätzfunktionen, das sind Zufallsgrößen zur Abschätzung der wahren Parameter. Die Schätzfunktionen stehen in Abhängigkeit der ursprünglichen Zufallsgrößen, bzw. in der Praxis in Abhängigkeit von deren Realisierungen bzw. den Messwerten. Bevor man sich mit Regression beschäftigt sollte man solche Schätzfunktionen erst am Beispiel von Mittelwert und Standardabweichung verstehen, dort besteht die einfachere Situation der Streuung von Messwerten um einen wahren Wert.

Bei einer Simulation mit vielen "Messwerten", die um die wahre rote Gerade gleichverteilt streuen, wird so gut wie immer das gleiche Bild entstehen, das aufzeigt dass die Minimierung der y-Fehlerquadratesumme die richtige Schätzung (der Parameter a,b) der wahren Gerade liefert.

[attach]52005[/attach]
HAL 9000 Auf diesen Beitrag antworten »

Neben der Quadratsummen-Minimierung der vertikalen oder alternativ der horizontalen Abstände gibt es auch noch die Möglichkeit, die Gerade zu berechnen, wo die Lotabstände der Punkte zur Geraden minimiert werden (natürlich wieder hinsichtlich deren Quadratsumme).

Das ist aber zum einen relativ kompliziert in der Berechnung, und macht zum anderen nur dann inhaltlich Sinn, wenn x- und y-Achse dieselbe physikalische Dimension haben. Ist das der Fall, dann würde eine solche Gerade insofern Sinn machen, dass sie in ihrer Lage bzgl. der zugrunde liegenden Punktmenge invariant ist gegenüber Drehungen des Koordinatensystems.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »