Linearregression: Fehler des Anstiegs

Neue Frage »

cst Auf diesen Beitrag antworten »
Linearregression: Fehler des Anstiegs
Hallo,

wie bestimmt man eigentlich den Fehler des Anstieges bei einer linearen Regression? Per Computerprogramm, ich weiß, aber ich will es aus Prinzip auch von Hand können. Es geht (zunächst) um eine Ursprungsgerade:



Minimieren der Fehlerquadratsumme



dürfte liefern



Aber mit welchem Fehler ist behaftet? Mir sind 2 Möglichkeiten in den Sinn gekommen:

1. Möglichkeit:
========
Ich kann aus jedem der Wertepaare einen Anstieg berechnen



und von diesen die empirische Standardabweichung bilden:



2. Möglichkeit:
=========
Anwendung ges Fehlerfortpflanzungsgesetzes

und (1) ergibt

Fall 2.1:
----------



Für hätte ich die Idee, die Fehlerquadratsumme (2) zu verwenden, also



Aber was setze ich dann für ein? Kann man überhaupt aus den Messwerten ein statistisch bestimmen?

Fall 2.2:
---------
Ich benutze als (3) als Bestimmungsgleichung für . Was soll ich dann aber in (5) wonach ableiten? verwirrt

Oder bin ich damit komplett auf dem falschen Dampfer? Die erste Möglichkeit scheint mir am einleuchtendsten, aber wie ist es richtig und wie macht es die Software?

Danke schonmal
cst
Mathematica Auf diesen Beitrag antworten »
RE: Linearregression: Fehler des Anstiegs
Hallo!

Also Möglichkeit 1 funktioniert nicht, weil du nicht aus einem Punkt eine Steigung ermitteln kannst. Möglichkeit 2 sehe ich überhaupt nicht... Meinst du mit "Fehler" die Varianz des Schätzers für den unbekannten Parameter? Für ein Konfidenzintervall oder einen Signifikanztest zum Beispiel?
cst Auf diesen Beitrag antworten »
RE: Linearregression: Fehler des Anstiegs
Hi,

der zweite Punkt ist , da ich eine Ursprungsgerade anpassen möchte. Im "Normalfall" wäre der zweite Punkt halt und dementsprechend



Ja, was ich berechnen will, ist für den Schätzer entweder die "empirische Standardabweichung" (meines Wissens auch bekannt als "mittlerer Fehler"), Tafelwerkformel



oder den Standardfehler (aka "mittlerer Fehler des Mittelwertes" aka "Unsicherheit" aka "Stichprobenfehler"), Tafelwerkformel


-- lässt sich ja beides leicht ineinender umrechnen.

Bzw. von der anderen Seite betrachtet: Computerprogramme zur Linearregression (bei uns Sigma Plot) berechnen neben dem Parameter (und ) auch dessen "StdErr".
1) Wie wird dieser "StdErr" berechnet?
2) Was bedeutet er/Wie ist er zu interpretieren?

lg
cst
Psycho Auf diesen Beitrag antworten »

Ist eigentlich recht einfach.

Kann leider die Formeln nicht so schön aufschreiben wie ihr, ich hoffe es ist trotzdem lesbar:

se=Wurzel [ Summe über i (quadrierte Epsilon) / n-k-1 ]


se.. Standardfehler des Schätzers
Epsilon.. Residuen (Differenz Schätzwert bzw Gerade und tatsächlicher Wert)


Lg,
Ulli
Psycho Auf diesen Beitrag antworten »

Achja, und klarerweise ist er auch dementsprechend zu interpretieren: als durchschnittliche Abweichung des geschätzten vom beobachteten Wert.

Sinnvoll ist das natürlich um beurteilen zu können, wie sehr du mit deiner Anwendung einer linearen Regression daneben liegst. Wendest du zb lineare an, während deine Daten in Wirklichkeit bspw quadratisch oder logarithmisch sind hast du dementsprechend große Standardfehler.

Nebenbei bemerkt sind normalverteilte Residuen ja Voraussetzung um deine Regression mittels F-Test auf Signifikanz berechnen zu können.
cst Auf diesen Beitrag antworten »

Vielen Dank schonmal, meinst du das so:

?

Das würde dann ja dimensionsmäßig nicht hinkommen, sondern ergäbe eher die durchschnittliche Abweichung der y's. Oder meinst du

?

Wenn ja, wie berechnet man dann die ? So?:


In jedem Fall gilt: Was ist ?

lg
cst
 
 
Psycho Auf diesen Beitrag antworten »

Hmm.. Also mit Residuen (epsilons bei uns) mein ich:

e(k)=y(k) - y'(k)


e(k)... Abweichungen des Schätzwertes vom Beobachtungswert
y(k)... Beobachtungswert der abhängigen Variablen Y
y'(k)... ermittelter Schätzwert von Y
Die unhübschen () meinen tiefgestellt ..


Ob du das nun standardisiert auf die gesamte Regression anwendest (und den mittleren Schätzfehler bekommst) oder auf einen einzelnen ist eigentlich *egal*...

Achja, und k sind bei uns immer die Anzahl der unabhängigen Variablen, und n die Anzahl der Beobachtungen !
cst Auf diesen Beitrag antworten »

Ah, okay, ist klar soweit. Aber ich befürchte, wir haben hier aneinander vorbei geredet. Ich such ja eigentlich die empirische Standardabweichung des Parameters (des Geradenanstiegs) , nicht die der Unabhängigen . Wie kriege ich denn die raus?

Gruß
cst
Mathematica Auf diesen Beitrag antworten »

Gegeben sei die Regressionsfunktion mit dem Schätzer . Durch Einsetzen der Regressionsfunktion ergibt sich . Daraus ergibt sich unter der Erwartungswert . Für die Varianz gilt damit . Weiter ist eine Standardannahme , womit folgt . Den Schätzer für kannst du dem Beitrag von Psycho entnehmen, der Rest sind einfach die Werte für (der Achsenabschnitt ist einfach ein Vektor mit Einsen). Aufgepasst, die gesamte Datenmatrix muss verwendet werden!
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »