Wie am besten schätzen bei vielen Variablen?

Neue Frage »

Martial Auf diesen Beitrag antworten »
Wie am besten schätzen bei vielen Variablen?
Hi,
habe im Moment folgendes Problem.

A B1 B2 C1 C2
1 125 148 142 204
2 109 167 159 123
2 150 118 150 139
12 127 154 109 180
3 166 122 174 128
6 143 144 97 142
4 135 130 177 115
5 132 138 154 102
3 132 135 149 116
11 125 136 167 121

Aus der Vergangenheit habe ich diese Werte und nun will ich wissen, wie man A am besten schätzen/bewerten kann, wenn man die Variablen B1, B2, C1 und C2 zur Seite hat? Ich bin leider ein Mathelaie und weiß nicht, wie ich es z. B. in Excel auswerten kann.

Wie würdet ihr hier am besten vorgehen und mit welcher Fuktion?

lg Martial
Huggy Auf diesen Beitrag antworten »
RE: Wie am besten schätzen bei vielen Variablen?
Zunächst sollte man sich die Daten mal plotten. Dann sieht man für A optisch keine Abhängigkeit von einer der Einflussgrößen. Und deshalb wird auch kein Programm eine sinnvolle Abhängigkeit hineinmathematisieren können.
Martial Auf diesen Beitrag antworten »

Es geht hier um genau zu sein um Baseball:

A = Punkte für die B-Mannschaft

B1 = Gesamtpunktzahl (der letzten 32 Spiele) der Mannschaft B
B2 = Gesamtpunktzahl (der letzten 32 Spiele) von den Gegnern von Mannschaft B

C1 = Gesamtpunktzahl (der letzten 32 Spiele) der Mannschaft C
C2 = Gesamtpunktzahl (der letzten 32 Spiele) von den Gegnern von Mannschaft C

Mein Ziel ist es also aus der Vergangenheit die Daten zu nehmen und die durschnittliche Punktzahl zu ermitteln für das Team B (A)in einem Spiel, wo eben diese 4 Variablen gegeben sind (B1, B2, C1, C2).

Mannschaft B vs. Mannschaft C

A = ? B1 = 144 B2 = 109 C1 = 134 C2 = 147

Gesucht ist A

lg Martial
Huggy Auf diesen Beitrag antworten »

Auch mit diesen Informationen sehe ich noch keinen vernünftigen Ansatz. Das kann natürlich daran liegen, dass ich von Baseball keine Ahnung habe.
wisili Auf diesen Beitrag antworten »

Aus Neugier habe ich mal mit Excel die multiple lineare Regression (Matrix-Funktion RGP) ausprobiert: Huggy hat recht, man sieht nichts Brauchbares.

[attach]15839[/attach]

(horizontal sind die A-Werte, vertikal die durch Regression aus B1, B2, C1 und C2 berechneten abgetragen. Der Korrelationskoeffizient beträgt 0.4, was bei so kleiner Stichprobe eigentlich nichts bedeutet.)
Martial Auf diesen Beitrag antworten »

Vielleicht muss man ja noch mehr Daten mit reinnehmen. Bei mir war das jetzt halt nur ein plumpes Beispiel mit den paar Spielen aus der Vergangenheit. Die Baseballsaison hat sicherlich mehr Spiele

Hmm ........

Aber es muss doch vielleicht doch irgendeinen Zusammenhang geben zwischen den gewonnen Punkten und den verlorenen Punkten. Ein Team gewinnt ja auch mit vielen Punkten (B1) z. B. öfter gegen ein Team, dass durchschnittlich mit hohem Punkteabstand verliert (C2).
 
 
wisili Auf diesen Beitrag antworten »

Ja, ich denke auch, dass ein paar hundert Datensätze nötig sind.
Der Korrelationskoeffizient ist ja nicht 0. Und inhaltlich hat man tatsächlich Gründe anzunehmen, dass ein Zusammenhang besteht. Ob er allerdings nicht zu schwach ist, um ihn verwerten zu können, steht noch nicht fest.
wisili Auf diesen Beitrag antworten »

@Martial
Per PN habe ich 1700 Datensätze von dir erhalten.
Deine PN sind aber gesperrt.
Mit Excel stellt sich mit RGP wieder nichts Brauchbares ein (Korrel.koeff. 0.1).
Das sollte man zum eigentlichen Resultat machen:
Der an sich einleuchtende bzw. erwartete Zusammenhang ist überraschend schwach.

Nachtrag: A_Schätzung = (b1+c2)/64 korreliert noch schlechter. Teste es bitte mit Excel!
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »