Wahrscheinlichkeitsmaß richtige Wahl zu treffen

Neue Frage »

Vidal Auf diesen Beitrag antworten »
Wahrscheinlichkeitsmaß richtige Wahl zu treffen
Hallo,

leider kenne ich die ganzen Fachbegriffe nicht. Deswegen erkläre ich einfach mal das Konzept von dem, was ich gerne wissen möchte. (sorry traurig )

Angenommen ich habe ein Becken mit blauen und roten Bällen.

Ich habe eine Maschine, die versucht vorauszusehen welchen Ball (blau oder rot) ich als nächstes ziehe.

Ich kriege von der Maschine eine Bewertungszahl, die aussagt wieviel % der Bälle richtig vorausgesagt wurden.
Ich möchte wissen wie viel besser die Maschine ist als eine Zufallsmaschine.

Ich erkläre mal den einfachen Fall mit dem ich keine Schwierigkeiten habe:
Angenommen es sind 50 rote und 50 blaue Bälle im Becken.

Dann weiß ich, dass die Zufallsmaschine im Durchschnitt zu 50% richtig liegt.
Wenn meine andere Maschine besser als 50% ist, dann weiß ich, dass sie besser funktioniert als die Zufallsmaschine. Bei 60% ist die Maschine 10% besser als der Zufall. Super!

Aber angenommen es sind nicht 50 rote und 50 blaue Bälle im Becken, sondern z.B. nur 10 rote und 90 Blaue?

Intuitiv weiß ich, dass eine Maschine mit mit einer Bewertung von 50% in diesem Fall ziemlich schlecht sein muss. Denn ich könnte ja einfach nur blaue Bälle voraussagen und diese Maschine wäre trotzdem besser als 50% oder?

Meine Frage ist also: Wenn ich weiß wieviele blaue und rote Bälle im Becken sind, wie kann ich dann wissen mit welcher Wahrscheinlichkeit eine Zufallsmaschine richtig liegen würde?

Danke schon malsmile
HAL 9000 Auf diesen Beitrag antworten »

Ich werde aus deiner Beschreibung nicht wirklich schlau, was du eigentlich wissen willst. Daher nur kurz meine Gedanken zu deinem Szenario:

Ok, der wahre Anteil blauer Bälle sei , der roter Bälle somit

Die Maschine ist nun so eingestellt, dass sie mit Wahrscheinlichkeit blau rät, entsprechend mit Wahrscheinlichkeit rot.

Dann liegt die Maschine mit Wahrscheinlichkeit richtig.

Ist nun , dann wird die Ratewahrscheinlichkeit der Maschine offenbar dann maximal, wenn sie mit läuft, also immer "blau" rät, und die Erfolgsquote ist in diesem Maximalfall dann natürlich auch gleich . Mehr ist nicht drin, sofern die Maschine wirklich unabhängig von der Ziehung rät.
Vidal Auf diesen Beitrag antworten »

Ahhh. Danke für den Beitrag. Ich glaube ich hatte ein paar Denkfehler und ich bin einfach steckengeblieben. Denksperre aufgehoben und endlich geht es weiter. Freude Wink

Jetzt bin ich glaube ich wieder auf dem richtigen Dampfer.

Man könnte also erstens eine Zufallsmaschine formulieren, die einfach nach der Anzahl Klassen wählt (bei zwei Klassen einfach 50/50 aussuchen)

Dann eine zweite Zufallsmaschine, die zusätzlich die Distribution der Bälle weiß (90/10).

Dazu sagst du:
Zitat:

dann wird die Ratewahrscheinlichkeit der Maschine offenbar dann maximal, wenn sie mit q=1 läuft, also immer "blau" rät


Das hat mich interessiert. Ich hätte jetzt gedacht eine Maschine, die die Distribution der Bälle kennt und zu 90% blau wählt und zu 10% rot wäre besser als eine Maschine, die nur blau wählt.
Ich habe alle drei Maschinen mal ausprobiert in Python um das mal in einer Simulation zu überprüfen (bin leider ziemlich schlecht in formaler Mathematik unglücklich )

Tatsächlich. Die "immer blau" Maschine gewinnt mit einem Becken von 900 blauen Bällen und 100 roten Bällen:

code:
1:
2:
3:
4:
5:
Ziehung von 1000 Bällen (900 blau, 100 rot)
Hälfte/Hälfte Maschine:  52.1  % richtig geraten ( 521 ) Treffer
Gewichtet Maschine:  82.0  % richtig geraten ( 820 ) Treffer
ImmerBlau Maschine:  90.0  % richtig geraten ( 900 ) Treffer


Zuerst war ich etwas verwundert darüber, dass die Hälfte-Hälfte Maschine immer noch um die 50% lag. Aber klar... egal wieviele Bälle rot oder blau sind, sie liegt im Mittel ja zu 50% richtig, wenn sie jeweils immer die eine oder andere Farbe wählt)

Wer sich fragt: "Ähhh und warum jetzt das ganze?"

Es ging mir darum einzuschätzen, wann ein bestimmten Modell besser im Schätzen ist als Zufall. Angenommen ich habe zusätzliche Daten, sozusagen einen zusätzlichen "Geheimtipp" bei der Ziehung von Bällen bekommen (Die Anzahl/Verteilung der roten und Blauen Bälle ist bekannt)

Diese zusätzlichen Informationen sind in diesem Fall nur dann wertvoll, wenn sie die Maschine besser machen als die "Immer-Blau"-Maschine.
Angenommen jemand würde mir eine Maschine andrehen, die besser schätzt als die Hälfte/Hälfte-Maschine aber schlechter als die ImmerBlau-Maschine, dann stehe ich eig. schlecht da, obwohl es so scheint als würde diese Maschine besser sein als Zufall.

Ich hoffe keiner hält mich für verrückt und hoffe, das war so verständlich.

Danke noch mal HAL 9000.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »