Regressionsgerade - Kovarianz und Korrelation

Neue Frage »

Abinus21 Auf diesen Beitrag antworten »
Regressionsgerade - Kovarianz und Korrelation
Hallo,
Wir haben gestern eine Aufgabe gestellt bekommen, in der nach dem linearen Regressionsmodell gefragt wurde. Nun wurde aus der Aufgabe nicht klar, ob es sich bei den Daten um eine Grundgesamtheit oder eine Stichprobe handelt. Dies sei jedoch für den Ausgang der Aufgabe unerheblich.
Nun hat der Prof uns auch gesagt, dass die Varianzen der Grundgesamtheit und der Stichprobe zwar unterschiedlich sein können, aber die Kovarianzen immer gleich sein müssen.
Ich habe die Aufgabe sowohl als Grundgesamtheit als auch als Stichprobe gerechnet und komme auf unterschiedliche Kovarianzen für Stichprobe und Grundgesamtheit.
Im weiteren Verlauf sind die Korrelationen und alle weiteren Schritte zur Bildung der Regressionsgerade jedoch wieder in beiden Fällen gleich. Die Regressionsgerade auf Basis der Grundgesamtheit entspricht der Regressionsgerade auf Basis der Stichprobe. Der Wert meiner Kovarianz für die Stichprobe entspricht auch dem Wert vom Prof, aber der Wert der Kovarianz für die Grundgesamtheit ist halt unterschiedlich. Der Wert der Kovarianz für die Grundgesamtheit ist mir nicht bekannt, aber er müsste ja laut seiner Aussage gleich mit dem Wert der Kovarianz der Stichprobe sein.
Ich verstehe jetzt jedoch seine Aussage nicht, da ich auch keinen Fehler bei mir erkenne. Müsste man nicht schreiben, dass die Varianzen und Kovarianzen für Grundgesamtheit und Stichprobe unterschiedlich sein können, aber die Korrelationen jeweils gleich sein müssen? Die Korrelation für eine Grundgesamtheit und seine Stichprobe muss doch jeweils gleich sein oder habe ich da etwas falsch verstanden? Könnte mir jemand die Aussage meines Profs erklären oder erläutern, was bei mir falsch sein könnte? Hat er Kovarianz mit Korrelation vertauscht?
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von Abinus21
Nun hat der Prof uns auch gesagt, dass die Varianzen der Grundgesamtheit und der Stichprobe zwar unterschiedlich sein können, aber die Kovarianzen immer gleich sein müssen.

Diese Aussage ist absurd. Kann mir auch schwer vorstellen, dass die so gefallen ist - irgendwo in der Übermittlungskette scheint hier ein Fehler vorzuliegen.

Du gehst von einer zweidimensionalen Verteilung der Grundgesamtheit aus, im Idealfall meint man meistens eine zweidimensionale Normalverteilung mit Mittelwertvektor und 2x2-Kovarianzmatrix , wobei man für die Varianzen auch gern sowie schreibt, d.h. als Quadrat der zugehörigen Standardabweichungen.

Zieht man nun eine Stichprobe vom Umfang aus dieser Grundgesamtheit, d.h., und betrachtet die daraus berechenbaren EMPIRISCHEN Varianzen und sowie auch die empirische Kovarianz , so sind diese Werte als Realisierungen von Zufallsgrößen stets nur Schätzungen der entsprechenden Werte der Grundgesamtheit. Sie sind erwartungstreu und auch konsistent, aber dennoch nicht gleich den theoretischen zugehörigen -Werten, d.h., auch bei der Kovarianz gilt i.a. . Entsprechend variieren die -Werte auch, wenn wir mehrfach unterschiedliche Stichproben aus derselben Grundgesamtheit nehmen - ist wie immer in der Statistik (nicht nur bei Regressionsproblemen).
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »