Allgemeine Fragen zur linearen Regression

Neue Frage »

SDwarfs Auf diesen Beitrag antworten »
Allgemeine Fragen zur linearen Regression
Wie mir scheint habe ich ein Grundlegendes Verständnisproblem mit der linearen Regression bzgl. der Voraussetzungen dafür und zwar:

Ich habe i verschiedene Items eines Fragebogens. Um Zusammenhänge zu berechnen (also lineare Korrelationen/Kovarianzen), was muss ich dafür "tun"?

Muss ich generell die Verteilungsfunktionen der Items beachten oder kennen, um sinnvoll zusammenhänge zu erkennen oder muss ich z.B. erst alle Items "linearisieren"?

Was hat die Normalverteilung damit zu tun? In den Übungen sollten wir bei Fragebögen ständig "prüfen", ob die Skalen "normalverteilt" sind. Brauch ich das überhaupt? Wofür muss man sowas prüfen? Wie ist der mathematische Hintergrund dazu?

Stefan
Besserwisserin Auf diesen Beitrag antworten »
RE: Allgemeine Fragen zur linearen Regression
Hallo Stefan!

Die klassische Regressionsrechnung nach der Methode der kleinsten Quadrate ist verteilungsfrei. Du brauchst eine Verteilung "nur" für statistische Inferenz, also wenn du einen geschätzten Parameter auf Signifikanz testen willst etc. Unter den Annahmen des klassischen Regressionsmodells ist der Parametervektor asymptotisch normalverteil, daher wird i. d. R. die Normalverteilung herangezogen als Testverteilung (genau gesagt die t-Verteilung). Allerdings gibt es auch eine ganze Menge Schätzverfahren wie die Maximum Likelihood-Methode die nicht zwangsläufig Normalverteilung unterstellen.

Bei einem konkreten Problem könnte ich auch konkreter helfen...
SDwarfs Auf diesen Beitrag antworten »

Ich hab heute woanders was mit "normalverteilten Residuen" gelesen.

Ich hab da nun eine Theorie, was da in meinem Hirn mit Normalverteilung und Regression zusammengefummelt hat:

Wenn ich eine Regresssionsfunktion errechnet habe, sollen die einzelnen Fehlerwert (also die Abweichungen von der Regresssionsfunktion) den Erwartungswert 0 haben...
Evtl. sind die Fehlerwerte dann auch Normalverteilt mit Erwartungswert 0 und einer Varianz, die möglichst klein ist?

Und (hab ich das korrekt verstanden?):
Wenn der Erwarungswert für die Fehlerwerte nicht 0 ist, sollte das ein Indiz dafür sein, dass die errechnete Regressionsfunktion nicht ideal ist, d.h. noch irgendwelche Zusammenhänge nicht durch die Regressionsfunktion abgebildet werden.

LG,
Stefan
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »