Problem mit Erwartungswert

Neue Frage »

Karina83 Auf diesen Beitrag antworten »
Problem mit Erwartungswert
Hallo Wink ,

Ich habe ein Model, dass Vorhersagen über Temperaturen in der Zukunft macht. Ich will in einer Arbeit dazu schreiben, dass ich die Vorhersage dieses Modelles als eine Art "subjektiven bedingten Erwartungswert" nehmen auf Basis dessen ich dann Empfehlungen abgebe. Ich würde das ganze gerne mathematisch darstellen. Leider sind bei den Temperaturvorhersagen auch Werte von -300 usw möglich, die in der Realität nicht vorkommen können (weil die tieftmögliche Temperatur -278 ist). Ich will dann etwas sagen wie, wenn die Vorhersage < -278, dann nehme ich als "sbjektiven Erwartunsgswert" -278 an wenn, andernfalls: Erwartungswert = Vorhersage. Kann mir einer erklären, wie ich das mathmatisch korrekt formulieren kann? Vor allem, habe ich ja jetzt zwei Wahrscheinlichkeitsverteilungen: die der Vorhersagen und die der wahren Temperaturen. Wie bringe ich das nur zusammen? ( Ich hoffe ich habe mich hier klar ausgedrückt. Danke schon mal an alle.

Gruß,

Karina
wisili Auf diesen Beitrag antworten »
RE: Problem mit Erwartungswert
Ungefragte Ratschläge:
1.
"subjektiver bedingter Erwartungswert" macht deine Arbeit nicht wissenschaftlicher, ganz im Gegenteil.
2.
Die wahren Temperaturen haben keine W'keitsverteilung.
3.
Der absolute Temperaturnullpunkt liegt bei -273.15°C.
Karina83 Auf diesen Beitrag antworten »
RE: Problem mit Erwartungswert
1. es geht ja auch nicht darum, dass es wissenschaftlicher wird, sondern, dass ich präzise erklären kann, wie ich zu meinen Empfehlungen komme
2. selbstverständlich haben Temperaturen eine Warscheinlichkeitsverteilung
3. ich habe nie grad Celsius als einheit angegeben :-)
Karina83 Auf diesen Beitrag antworten »
RE: Problem mit Erwartungswert
Das Problem ist doch ganz einfach. Wie soll ich rechtfertigen, dass wenn aufgrund des zugrundeliegenden Modelles die Vorhersagen unmögliche Werte annehmen können, ich die Konfidenzintervalle und den Erwartungswert so hinnehme?
BarneyG. Auf diesen Beitrag antworten »

Also zunächst mal musst du uns verraten, welche Temperaturen denn hier überhaupt zur Diskussion stehen. Sind das die Mittagstemperaturen am Timmendorfer Strand im August oder die maximalen Temperaturen in einem Hochofen der Thyssen Krupp AG. smile

Abhängig von der Umgebung ergeben sich doch ganz unterschiedliche Verteilungen ... und erst dann kann man sich darüber Gedanken machen, wie man das modelliert.

Wenn man den Sachverhalt dann beispielsweise über die Normalverteilung annähert, dann wären tatsächlich Werte unterhalb -273 Grad Celcius nicht vollkommen ausgeschlossen ... aber abhängig von Mittelwert und Standardabweichung sind diese Werte vermutlich so unwahrscheinlich, dass man sie vernachlässigen kann. Es handelt sich eben um eine Annäherung der Wirklichkeit ...

Grüße
Karina83 Auf diesen Beitrag antworten »

Das jetzt alles genauer zu erklären würde zu weit führen, es geht hier um tiefe Temperaturen, nahe absolut null. Es geht mir auch nicht unbeding um die eigentliche Modellierung sonder nur um das Problem, was ich oben geschildert habe.

Nehmen wir mal ein einfaches Beispiel. Angenommen ich führe eine lineare Regression durch, bei der ich Körpergewicht (endogen) mit Körpergröße (exogen) erklären will. Der Zusammenhang ist offensichtlich nicht linear. Deshalb würden "Vorhersagen" des Körpergewichts unter einer gewissen vielleicht negativ Körpergröße negativ ausfallen, trotzdem könnte man ja "Konfidenzintervalle" angeben, die nun aber offensichtlich unsinnig sind, weil eben fälschlicherweise ein lineares Modell zu Grunde gelegt wurde. Dennoch, wenn mir aus bestimmten Grüden nur lineare Regression zur Verfügung steht möchte ich doch trotzdem Aussagen treffen können wie: "Ich glaube der Vorhersage, wenn der Wert positiv ist, sollte die V. aber negativ ausfallen, nehme ich x an". Das Beispiel ist natürlich jetzt an den Haaren herbeigezogen. Ich möchte jetzt einfach etwas definieren was ich oben spasseshalber als "subjektiven Erwartungswert" bezeichnet habe, will aber sicherstellen, dass das auch mathematisch geht.
 
 
BarneyG. Auf diesen Beitrag antworten »

Also, ich fasse das mal kurz zusammen:

Du berechnest also mit einem völlig falschen Modell einen Erwartungswert. Wenn der erhaltene Wert möglich ist, dann glaubst du daran. Wenn der erhaltene Wert aber offensichtlich Unfug ist, dann glaubst du nicht daran, sondern glaubst an irgend etwas anderes.

Mit Glaubensfragen beschäftigt man sich aber eher in der Theologie und nicht so sehr in der Mathematik. Big Laugh

Selbst wenn die Werte, die du mit dem falschen Modell berechnest alle plausibel sein sollten, wie würdest du denn dann deren Verlässlichkeit einschätzen. Möglichweise kriegst du mit einem Münzwurf bessere Vorhersagen ... Big Laugh

Grüße
Karina83 Auf diesen Beitrag antworten »

Nochmal: die Güte der Vorhersagen wird nicht daran gemessen, wie genau sie sind, sondern welchen Erfolg die "Handlungsentscheidungen" haben die aus den Vorhersagen abgeleitet werden. Wenn man dann verschiedene Modelle vergleicht, findet man, dass das das einzige Model ist woraus sich gute Entscheidungen ableiten lassen, auch wenn die Vorhersagen TEILWEISE unmöglich sind. Ausserdem ist ein Modell immer "falsch". Es ist hier ausser Frage, dass genau das Model verwendet wird, die einzige "technische" Frage ist noch wie man mathematisch formuliert, was ich da oben beschrieben habe. Und bitte nicht alles wort wörtlich nehmen. Wenn ich sage, ich "glaube" an vorhersagen, heisst das natürlich nur, dass ich diesen Wert dann annehme um meine Empfehlung abzugeben.
Karina83 Auf diesen Beitrag antworten »

Mit Glaubensfragen beschäftigt man sich aber eher in der Theologie und nicht so sehr in der Mathematik. Big Laugh


Ich glaube da hast du noch nicht richtig verstanden was Mathematik eigentlich macht. Wahre Mathematik beschäftigt sich nur mit Glaubensfragen, siehe Auswahlaxiom usw.
Abakus Auf diesen Beitrag antworten »
RE: Problem mit Erwartungswert
Zitat:
Original von Karina83
Ich will dann etwas sagen wie, wenn die Vorhersage < -278, dann nehme ich als "sbjektiven Erwartunsgswert" -278 an wenn, andernfalls: Erwartungswert = Vorhersage. Kann mir einer erklären, wie ich das mathmatisch korrekt formulieren kann?


Hallo!

Du definierst deinen Schätzer T (du suchst ja eine Schätzfunktion und ggf. dazu ein Konfidenzintervall) wie folgt:



Zitat:
Angenommen ich führe eine lineare Regression durch, bei der ich...


Hier bietet sich der Bestimmtheitskoeffizient an, um etwas über die Güte der Regression auszusagen.

Grüße Abakus smile
Karina83 Auf diesen Beitrag antworten »
RE: Problem mit Erwartungswert
Danke Abakus, so ähnlich steht das schon in meiner Arbeit:

Sei X der Wert der von meinem Modell vorhergesagt wurde (das ist leider kein mathematisch wohldefinierter Erwartungswert sondern nur etwas, was hinten aus einem Modell als Vorhersage "rausfällt") und Z der wahre Wert

Dann muss ich von der Vorhersage zu einer Handlungsempfehlung kommen. An der Stelle muss ja nun irgendwas kommen, was klarstellt, dass unmögliche Vorhersagen natürlich nicht als "wahr" angenommen werden. Ich brauche eine mathematische Formulierung für die Transformation von den Vorhersagen des Modelles zu einem Wert den ich dann "erwarte".

und


wobei eben mein subjektiver Erwartungswert ist (bedingt durch die Vorhersage). Aber so kann ich das sicher nicht einfach schreiben, ich muss ja nun irgendwie diesen mysteriösen sub. EW definieren und zeigen, dass es den auch wirklich gibt, auf welcher W'verteilung er basiert etc.

Kann ich vielleicht soetwas hier verwenden?
http://suppes-corpus.stanford.edu/articles/mpm/321.pdf
Abakus Auf diesen Beitrag antworten »
RE: Problem mit Erwartungswert
Du hast zunächst einmal einen physikalischen Sachverhalt und eine W'Verteilung der Temperatur, die du aber nicht kennst: du hast also einen W'Raum , wobei du insbesondere nicht kennst und im weiteren Verlauf auch nicht kennen musst.

Jetzt hast du weiter eine Stichprobenfunktion und einen Stichprobenraum , wobei du die Verteilung aber nicht kennst, jedoch aufgrund deiner Voraussetzungen ja vielleicht eine Klasse von Verteilungen angeben kannst, unter denen sich befinden muss.

Auf deinem Stichprobenraum - ggf. ergänzt um deine Klasse von Verteilungen - definierst du nun eine Statistik (eine messbare Abb.), die dich zu deinen Handlungsempfehlungen bringen soll.

Etwa so?

Grüße Abakus smile
Karina83 Auf diesen Beitrag antworten »
RE: Problem mit Erwartungswert
Ich verstehe noch nicht ganz warum du von Stichproben sprichts. Meine Vorhersagen werden durch exogene Variablen generiert.

Vorhersage = f(X1, X2, X3...)

wobei f eine reellwertige Funktion ist.

Ich kann dir noch soweit folgen, dass du sagst wir haben einen W'Raum, bei dem P nicht bekannt ist, also die wahre Wahrscheinlichkeitsverteilung?.

Es gibt ja nun noch aber zwei andere, die "falsche" die von meinem Modell induziert wird und meine subjektive, die ich aus den Vorhersagen ableite?

Wenn ich dich richtig verstehe soll ich also keinen subjektiven bedingten Erwartungswert definieren sondern einen Schätzer? Aber wie erkläre ich damit wie sich die subjektiven Wahrscheinlichkeiten in meinem Kopf gebildet haben, die mich dazu veranlassen diese oder jene Entscheidung abzugeben.
Abakus Auf diesen Beitrag antworten »
RE: Problem mit Erwartungswert
Zitat:
Original von Karina83
Ich verstehe noch nicht ganz warum du von Stichproben sprichts. Meine Vorhersagen werden durch exogene Variablen generiert.

Vorhersage = f(X1, X2, X3...)

wobei f eine reellwertige Funktion ist.


Vermutlich habe ich dein Problem nicht genügend verstanden. Deine exogenen Variablen sind stochastische Variablen oder ist dein Modell deterministisch? Wie kommst du dann zu deiner W-Verteilung?

Zitat:
Wenn ich dich richtig verstehe soll ich also keinen subjektiven bedingten Erwartungswert definieren sondern einen Schätzer?


Dein Erwartungswert ist ja ein Schätzer, letztendlich suchst du ja den nach bestimmten Kriterien besten Schätzer?

Grüße Abakus smile
Karina83 Auf diesen Beitrag antworten »
RE: Problem mit Erwartungswert
Die exogenen variablen sind stochastisch.
Es liegt keine bekannte W'Verteilung vor. Ich meine nur, dass durch das Modell eine induziert wird die aber auch unbekannt ist. Man könnte die jetzt erforschen indem man ein Histogramm aus den Vorhersagewerten erzeugt, wo dann auch Wahrscheinlichkeitsmasse im "unmöglichen Bereich" <-278 liegen würde.

Aber noch mal, ich muss ja nun um Empfehlungen zu geben zu können von einer W'verteilung ausgehen wo die gesamte W'Masse im möglichen Temperaturbereich liegt
Abakus Auf diesen Beitrag antworten »
RE: Problem mit Erwartungswert
Zitat:
Original von Karina83
Aber noch mal, ich muss ja nun um Empfehlungen zu geben zu können von einer W'verteilung ausgehen wo die gesamte W'Masse im möglichen Temperaturbereich liegt


Nicht unbedingt: denke einmal an die IQ-Normalverteilung mit Erwartungswert 100 und Standardabweichung 15. Hier sind IQs unter 0 nicht möglich, die Verteilung liefert dafür aber eine (wenn auch geringe) Wahrscheinlichkeit. Das was jenseits der 6 (bzw. 7)-Sigma-Grenze liegt, lässt sich bei der Normalverteilung allerdings getrost ignorieren, weswegen dieses Modell der Intelligenzverteilung dennoch Sinn macht.

Eine Idee ist also, die Standardabweichung zu betrachten und damit zu zeigen (etwa Tschebyschew-Ungleichung etc), dass jenseits der kritischen Temperaturgrenze nicht mehr viel W'keit liegen kann. Dafür brauchst du allerdings eine gewisse Idee über deine Standardabweichung (und den Erwartungswert).

Ansonsten könntest du dein Modell auch modifizieren, was vielleicht die einfachste Idee ist?

Grüße Abakus smile
Karina83 Auf diesen Beitrag antworten »
RE: Problem mit Erwartungswert
Du scheinst ja wirklich kein Freund meiner Idee zu sein etwas zu neu zu definieren smile
Ich sag mal so, natürlich könnte man die W'Masse die im unmöglichen Bereich liegt ignorieren (aber leider sind das hier schon keine 6 standardabweichungen, eher so 10% der W'Masse liegen in diesem Bereich). Und trotzdem ist das Modell, in dieser Konfiguration, am nützlichsten. Das kommt so: die Vorhersagen dienen einem bestimmten Zweck und aus den Handlungsempfehlungen entsteht ein messbares Resultat. Das Modell ist nun darauf trainiert das Resultat zu maximieren, nicht aber auf Korrekheit der eigentlichen Werte. Korrekte Vorhersagen (im Sinne von kleinen Abweichungen zu den wahren Werten implizieren in unserem Fall keine guten Resultate). Wäre es denn falsch einfach eine subjektive W'Verteilung zu definieren?
BarneyG. Auf diesen Beitrag antworten »

Also das ist ja nun mehr als mystisch ....

Zitat:
Original von Karina83
Es liegt keine bekannte W'Verteilung vor. Ich meine nur, dass durch das Modell eine induziert wird die aber auch unbekannt ist.


Das muss man sich dann ja erst mal genüsslich auf der Zunge zergehen lassen. Big Laugh

Zitat:
Original von Karina83
Das Modell ist nun darauf trainiert das Resultat zu maximieren, nicht aber auf Korrekheit der eigentlichen Werte. Korrekte Vorhersagen (im Sinne von kleinen Abweichungen zu den wahren Werten implizieren in unserem Fall keine guten Resultate).


Wie "trainiert" man eigentlich ein Modell? Intervalltraining? Na ja ... wie auch immer ... Mit anderen Worten, je weiter die berechneten Werte von den realen Werten abweichen desto besser werden die Empfehlungen. Also nix für ungut aber zu diesen "Empfehlungen" hätte ich dann kein so richtiges Vertrauen.

Zitat:
Original von Karina83
Wäre es denn falsch einfach eine subjektive W'Verteilung zu definieren?


Definitionen sind weder richtig noch falsch. Sie sind allenfalls sinnvoll ... Die Frage ist nur was du damit anfangen willst ...

... ich habe nämlich gravierende Zweifel an der Modellierung des Problems. Es geht um Temperaturen nahe des absoluten Nullpunkts ... der übrigens nicht bei -278 sondern bei ca. -273,15 Grad Celcius liegt (soviel zur Genauigkeit der Fragestellerin). Was immer da auch betrieben wird, die Temperaturen dürften sich in diesem extremen Bereich alles andere als linear verhalten ... und jetzt geht man her und legt mit linearer Regression da einfach ein Gerade durch ... und stellt verblüfft fest, dass die "Wahrscheinlichkeitsmasse" zu großen Teilen irgendwo im Niemandsland liegt. War ja wohl auch zu erwarten, dass das Ganze nicht so richtig klappt!

Und jetzt will man vermittels subjektivem Erwartungswert "mathematisch" begründen, dass die Vorhersagen um so besser werden, je weiter die Regressionsgerade vom realen Verlauf abweicht ...

Na, viel Spaß dabei! Sachen gibt's ... Big Laugh

Grüße
giles Auf diesen Beitrag antworten »

Wie kommst du denn auf die Verteilung? Durch eine Simulation? Kannst ja mal mit der Nebenbedingung "nur reale Temperaturen" simulieren und gucken wie es aussieht. Es muss ja etwas grundlegend falsch an deiner Simulation oder der gesamten Methodik sein, wenn sie mit unmöglichen Temperaturen die besten Resultate liefert.
Das ist alles eine sehr absurde Situation. Dein Modell gibt physikalisch unmögliche Vorhersagen und die darauf basierenden Handlungsempfehlungen geben die besten Resultate egal ob die Temperaturen korrekt sind (besser als die Wahrheit?)... was ist denn die Empfehlung für eine Temperatur von -300 außer beim Nobelpreiskomitee anzurufen?

Und wenn alles so unabhängig davon ist ob deine vorhersage nun richtig ist oder falsch und es wirklich so nachweislich die besten Resultate (bzgl. der Metrik beste Empfehlung) liefert, warum dann der Drang die unmöglichen Temperaturen zu eliminieren, wenn es sowieso nie um die richtigkeit der Temperaturen ging?
Karina83 Auf diesen Beitrag antworten »

OK, ich denke hier ist jetzt Zeit aufzugeben. Scheinbar hat hier noch nie jemand an praktischen Problemen gearbeitet.

Zu dir Barney G. Du Pseudo Mathematiker: Wenn du dir mal die Mühe machen würdest meine Beiträge zu lesen und zu verstehen würdest du auch nicht diese dümmliche Kommentare abgeben. Ich verstehe auch nicht den sarkastischen Unterton in deinen Beiträgen.

1. Es geht nicht um Grad Celsius, es geht nicht mal um Temperaturen im klassischen Sinne das habe ich nur zur Vereinfachung gesagt. Ich will hier keinen Vortrag über Quantenphysik halten. Weil es auch für das eigenliche Problem völlig irrelevant ist.
2. Es geht natürlich auch nicht um eine triviale lineare Regression.
3. Ich verwende Genetische Programmierung und ANNs zur Vorhersage
4. korrekte Vorhersagen implizieren keine guten Handlungsempfehlungen

Stell dir vor du willst das Vorzeichen von etwas vorhersagen (Vereinfachung vom wahren Problem), dann kannst du die entsprechenden Modelle darauf trainieren. Wenn du das Vorzeichen richtig bekommst kannst du dann ableiten wie Energie zur Verfügung gestellt werden muss. Ist das Vorzeichen falsch kann das verheerende Konsequenzen haben. Also angenommen du machst Vorhersagen, die fast exakt sind aber das Vorzeichen ist immer falsch - > Resultat: extreme Energieverschwendung, hast du Vorhersagen die sehr ungenau sind bei denen aber das Vorzeichen immer stimmt ->gute Energiebereitstellung.

Du musst jetzt auch nicht auf meinen Formulierungen rumreiten. Wenn ich sage es wird eine Verteilung induziert meine ich damit, dass die Vorhersagen selbst einer W'Verteilung unterworfen sind. Da muss man sich auch nichts auf der Zunge zergehen lass du arrogantes A***. Du hast wahrscheinlich noch nicht mal dein Studium an deiner drittklassigen Uni abgeschlossen, also riskier hier nicht sone große Lippe. Ist ja peinlich.
wisili Auf diesen Beitrag antworten »

Zitat:
Original von Karina83
... Also angenommen du machst Vorhersagen, die fast exakt sind aber das Vorzeichen ist immer falsch ...


Dann sind eben die Vorhersagen Quatsch und sicher nicht exakt. Ende.
BarneyG. Auf diesen Beitrag antworten »

Tut mir leid, wenn meine spitze Feder deinen Zorn herausgefordert hat.

Ich habe - vielleicht etwas pointiert - darauf hingewiesen, dass mir die Modellierung fragwürdig erscheint. Und dafür habe ich gute Gründe genannt.

Wenn dir meine Argumente nicht gefallen ist das in Ordnung. Ob deine Reaktion darauf angemessen ist, musst du selber wissen.

EDIT: Ich sehe gerade, dass Leopold von einem halben Friedensangebot spricht. Dann will ich mal ein GANZES draus machen.

Peace? Ok? Ich bin auch nicht mehr so bissig ...

Grüße
Leopold Auf diesen Beitrag antworten »

@ Karina83

Zugegeben, BarneyG. war nicht besonders nett zu dir. Aber was du schreibst, ist gewiß auch nicht von schlechten Eltern. Ich finde, ihr solltet das jetzt lassen (am besten den Ärger hinunterschlucken und gar nichts mehr dazu sagen) und auf die sachliche Ebene zurückkehren. Augenzwinkern

Beim Problem selber kann ich dir nicht helfen, weil ich mich in Statistik zu wenig auskenne. Aber ich möchte es verstehen. Kann ich es an einem Beispiel veranschaulichen?

Nehmen wir an, der reale Wert einer Größe sei -1,23. Dann hast du zwei Modelle, die dir den wahren Wert schätzen sollen.

Modell 1 liefert dir die Schätzung 0,12, also eine Abweichung von +1,35 vom wahren Wert.
Modell 2 liefert dir die Schätzung -11,80, also eine Abweichung von -10,57 vom wahren Wert.

Dann würdest du dennoch sagen: Modell 2 macht mir hier die bessere Voraussage, weil es mir nur auf das Vorzeichen ankommt. Und bei Modell 2 wird das richtig vorhergesagt.

Es geht dir also darum, mit großer Wahrscheinlichkeit in das richtige Intervall bzw. zu treffen. Dagegen darf die Wahrscheinlichkeit, in ein Intervall um den wahren Wert herum zu treffen, klein sein. Irgendwie ist das ein Übersetzungsproblem kontinuierlich <-> digital. Und ob deine Bedingungen im Sinne der üblichen Wahrscheinlichkeitslehre miteinander vereinbar sind, weiß ich nicht.

Nehmen wir an, du kennst eine Größe , aus der sich eine reale Größe ergibt, deren Wert du schätzen willst, vielleicht so:

korrekter Wert:


Schätzung 1:


Schätzung 2:


Dann liefert dir die Schätzung 1 immer das richtige Vorzeichen, die Schätzung 2 dagegen nicht (nämlich für nicht), obwohl "im allgemeinen" ( groß) die Schätzung 2 näher am wahren Wert liegt.

Geht es um so etwas?

EDIT
Ich sehe gerade, daß dir BarneyG. schon ein halbes Friedensangebot gemacht hat. Annehmen! Augenzwinkern
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »