Schätzung Bino-Parameter p -> Wahrscheinlichkeit, dass nächste Ziehung Erfolg ist

Neue Frage »

Schueler Auf diesen Beitrag antworten »
Schätzung Bino-Parameter p -> Wahrscheinlichkeit, dass nächste Ziehung Erfolg ist
Hallo,

folgende Aufgabe: ich habe eine Urne mit 3 Kugeln, von denen eine unbekannte Anzahl weiß ist. Ich ziehe 10x eine Kugel heraus, und lege sie danach wieder in die Urne geschüttelt zurück. Bei den 10 Versuchen war in 3 Fällen die gezogene Kugel weiß.

Frage: Wie hoch ist die Wahrscheinlichkeit dass die nächste gezogene Kugel weiß ist?

Mein Ansatz:

Die Wahrscheinlichkeit dass sich in der Urne 0 weiße Kugeln befinden, und ich in 10 Versuchen 3x eine weiße gezogen habe ist 0.

Die Wahrscheinlichkeit dass sich in der Urne 1 weiße Kugel befindet, und ich in 10 Versuchen 3x eine weiße gezogen habe ist mit . Die Wahrscheinlichkeit, dass die nächste gezogene Kugel eine weiße ist, wenn von 3 Kugeln eine weiß ist, ist 0,333. Die Wahrscheinlichkeit dass sich eine weiße Kugel in der Urne befindet, und die nächste weiß ist, ist .

Analog 2 weiße Kugeln in der Urne, 3 Erfolge in 10 Versuchen: P=0,016, P(nächste weiß wenn 2 weiße drin)=0,667, gesamt 0,011.

Bei 3 weißen Kugeln in der Urne ist die Wahrscheinlichkeit auf nur 3 in 10 Versuchen wieder 0. Da in der Urne nicht gleichzeitig 1 und 2 weiße Kugeln sein können sollte die Gesamtwahrscheinlichkeit also P(nächste gezogene Kugel weiß) sein.

Das scheint aber nicht zu stimmen, eine Simulation ergibt über doppelt so hohe Werte. Gefühlsmäßig sollte das mit einem geschützten ja etwas unter 0,3 liegen. Jemand eine Idee warum? Vielleicht die Multiplikation in oberem Schritt nicht zulässig? Danke für Antworten! Wink
sibelius84 Auf diesen Beitrag antworten »

Hallo Schueler,

ich würde es evtl. mit dem Satz von der totalen Wahrscheinlichkeit versuchen:

,

falls die eine disjunkte Zerlegung des Ergebnisraums bilden.

In deinem Fall würde ich - auch da wir schon wissen, dass p=0 und p=1 ausgeschlossen sind - die Ereignisse B_i so wählen:

B_1 := { die Urne enthält eine weiße Kugel } = {p=1/3}
B_2 := { die Urne enthält zwei weiße Kugeln } = {p=2/3}.

Die bedingten Wahrscheinlichkeiten kannst du ganz einfach mit der Binomialverteilung für n=1 (also Bernoulli-Verteilung) berechnen. Die Wahrscheinlichkeiten P(B_1), P(B_2) ergeben sich aus den 3/10 (evtl. mit Bayes-Formel?) und da es hier nur zwei Ereignisse sind, hast du natürlich P(B_2)=1-P(B_1).

Ja, die Multiplikation sieht bei dir etwas bedenklich aus.

LG
sibelius84
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von sibelius84
.In deinem Fall würde ich - auch da wir schon wissen, dass p=0 und p=1 ausgeschlossen sind - die Ereignisse B_i so wählen:

B_1 := { die Urne enthält eine weiße Kugel } = {p=1/3}
B_2 := { die Urne enthält zwei weiße Kugeln } = {p=2/3}.

Weshalb das?

Die beiden Ausagen

- Die Urne enthält 1 weiße und 2 nicht weiße Kugeln
- Die Urne enthält 2 weiße und 1 nicht weiße Kugeln

gehen doch durch Vertauschen von Weiß und nicht Weiß ineinander über. Wenn man ihnen im Sinne der Bayes-Statistik eine priori-Wahrscheinlichkeit gibt, dann sollte diese für die beiden Aussagen gleich sein.
sibelius84 Auf diesen Beitrag antworten »

Naja, bei dem Experiment sind ja 3 von 10 weiße rausgekommen und nicht 7 von 10 weiße. Und man kann mit dem Ansatz eben schön P(A|B_1) und P(A|B_2) als stinknormale binomialverteilte Wahrscheinlichkeiten berechnen. Wenn man dann noch P(B_1)=P(B_2) (=0,5) annehmen kann, umso besser, hier war ich etwas unsicher.
Huggy Auf diesen Beitrag antworten »

Das ist kein sinnvolles Vorgehen. Man sieht das, wenn man das Ergebnis des 10-maligen Ziehens einer Kugel mal variiert. Es sei dabei 10 mal eine weiße Kugel gezogen worden. Dann ergibt dein Vorgehen eine priori-Wahrscheinlichkeit von 1 für 3 weiße Kugeln in der Urne und 0 für alle anderen Möglichkeiten. Daraus ergibt sich die Wahrscheinlichkeit 1, dass die nächste gezogene Kugel weiß ist. Aber offensichtlich kann sich das Ergebnis 10 mal Weiß auch bei anderen priori-Wahrscheinlichkeiten ergeben. Niemand würde vernünftigerweise behaupten, dass die Wahrscheinlichkeit 1 ist, dass die nächste gezogene Kugel wieder weiß ist, nur weil man vorher 10 mal nur eine weiße Kugel gezogen hat.

Weder Bayesianer noch Frequentisten würden deinem Vorgehen zustimmen.
sibelius84 Auf diesen Beitrag antworten »

Wenn 10 mal eine weiße gezogen worden wäre, dann würde mein Vorgehen liefern

.

Hierbei ist der erste Faktor im letzten Summanden tatsächlich 1, aber er wird ja noch mit der a-priori-Wahrscheinlichkeit multipliziert.

Oder meinst du, dass man den Summanden für p=0 nicht weglassen sollte, selbst wenn 10 weiße Kugeln herausgekommen sind - weil ja die a priori-Wahrscheinlichkeiten immer "stur" als gleich angenommen werden müssen? So dass bei der von dir vorgeschlagenen Gleichaufteilung der Faktor 1/4 wäre und nicht 1/3? Das ergäbe für mich Sinn, da ja die bedingten Wahrscheinlichkeiten in den entsprechenden Fällen bereits 0 sind und die entsprechenden Summanden damit automatisch wegfallen.
 
 
Huggy Auf diesen Beitrag antworten »

Um etwas rechnen zu können, braucht man die Wahrscheinlichkeiten für die 4 möglichen Urnenfüllungen vor der Kenntnis der Stichprobe, die priori-Wahrscheinlichkeiten. Diese sind in in der Aufgabe nicht gegeben.

Damit bewegt sich das weitere Vorgehen zunächst außerhalb der reinen Mathematik. Die einen würden sagen, wenn diese Wahrscheinlichkeiten nicht gegeben sind, dann kann man halt nichts rechnen. Die Bayesianser würden auch dieses Unwissen mit einer Wahrscheinlichkeit kodifizieren. Da es ohne Kenntnis der Stichprobe keinen Grund gibt, zwischen den 4 möglichen Füllungen zu differenzieren, würden sie jeder Möglichkeit die gleiche priori-Wahrscheinlichkeit zuordnen. In deiner Notation:



Über den weiteren Rechengang sind wir uns einig. Das ist dann wieder reine Mathematik. Aufgrund der Kenntnis der Stichprobe berechnet man mit dem Satz von Bayes die posteriori-Wahrscheinlichkeiten. Mit diesen berechnet man die Wahrscheinlichkeit für Weiß in der nächsten Ziehung.
sibelius84 Auf diesen Beitrag antworten »

Mir war auch der Gedanke gekommen, ob die Aufgabe so eigentlich korrekt gestellt ist. Ein ähnliches Beispiel wäre: "Sie haben 3x gewürfelt mit den Ergebnissen 1, 5, 2. Wie hoch ist die Wahrscheinlichkeit, dass die nächste gezogene Zahl eine 6 ist?" Da müsste entweder offener gefragt werden, wie "Was können Sie über die Wahrscheinlichkeit aussagen, dass die nächste gewürfelte Zahl eine 6 ist?", oder dezidiert dazugesagt werden "Approximieren Sie die wahrscheinliche Wahrscheinlichkeit im Sinne der Bayes-Statistik".
Einfach mal eine Gleichverteilung der unbekannten a priori-Wahrscheinlichkeiten anzunehmen und zu probieren, wie weit man damit kommt, ist aber an sich schon irgendwie eine clevere und innovative Idee. Erinnert mich ein wenig an die Entdeckung der komplexen Zahlen. "Wir rechnen mal mit der Wurzel aus -1 weiter und schauen, wie weit wir kommen." Das hat uns letztlich zB holomorphe Funktionen beschert, Objekte unvergleichlicher Schönheit.
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von sibelius84
Mir war auch der Gedanke gekommen, ob die Aufgabe so eigentlich korrekt gestellt ist.

Mich würde interessieren, was sich der Lehrer bei dieser Aufgabenstellung gedacht hat? Wahrscheinlich nichts!

Zitat:
Einfach mal eine Gleichverteilung der unbekannten a priori-Wahrscheinlichkeiten anzunehmen und zu probieren, wie weit man damit kommt, ist aber an sich schon irgendwie eine clevere und innovative Idee.

So einfach ist das allerdings nicht. Wenn der Wertebereich eines unbekannten Parameters nicht aus einer endlichen Zahl diskreter Werte besteht, funktioniert das mit der Gleichverteilung als priori-Verteilung nicht mehr generell. Angenommen, man hat eine Normalverteilung, von der bekannt ist, aber nicht. Der mögliche Wertebereich von ist . Wie legt man die priori-Verteilung von fest?

Eine Gleichverteilung gibt es ja auf dem Intervall nicht. Das erweist sich allerdings lediglich als ein technisches Problem und nicht als ernstes Hindernis. Ernsthafter ist ein anderes Problem: Angenommen man hat eine Vorschrift zur Festlegung der priori-Verteilung und wendet sie auf an. Nun hätte man doch mit gleichem Recht als den unbekannten Parameter nehmen können. Der hat denselben Wertebereich. Also sollte man dieselbe priori-Verteilung für und für nehmen können. Aber das ist widersprüchlich. Denn mit dem Transformationssatz kann man die eine priori-Verteilung in die andere umrechnen und das ergibt nicht dieselbe priori-Verteilung. Erstaunlicherweise scheinen die Bayesianer für diese Problematik mit dem Jeffrey's-Prior eine zufriedenstellende Lösung gefunden zu haben. Nach meinem Wissensstand gibt es aber keine allgemein anerkannte Lösung, wenn gleichzeitg 2 oder mehr Parameter einer Verteilung unbekannt sind.
Schueler Auf diesen Beitrag antworten »

Zitat:
Original von Huggy
Die einen würden sagen, wenn diese Wahrscheinlichkeiten nicht gegeben sind, dann kann man halt nichts rechnen.


Das sehe ich nicht so, schließlich kann man die sichere Aussage treffen, dass die Wahrscheinlichkeit (unter der Voraussetzung dass die Ziehungen jedesmal komplett gleich ablaufen), in meinem Beispiel zumindest nicht 0 und nicht 1 ist. Auch für die Werte dazwischen, wenn man nichts anderes hat, kann man doch zumindest und damit eine Wahrscheinlichkeit von 0,33 für nächste Kugel weiß schätzen.

Zitat:
Original von sibelius84
Ein ähnliches Beispiel wäre: "Sie haben 3x gewürfelt mit den Ergebnissen 1, 5, 2. Wie hoch ist die Wahrscheinlichkeit, dass die nächste gezogene Zahl eine 6 ist?".


Das Bsp. finde ich nicht gut gewählt, da im Gegensatz zu meinem Problem kein einziger Erfolg auftritt. Hier könnte man zumindest sagen die Wahrscheinlichkeit einer 6 ist nicht 1.

Wie dem auch sei, ich habe nach wikipediastudium das ganze nach dem Satz von Bayes bei einer apriori-Gleichverteilung p(w0=0)=...=P(w0=3)=0,25 durchgerechnet und bin auf



gekommen, was auch mit der Simulation sehr gut übereinstimmt. smile Dabei habe ich auch gelernt, dass man das Ergebnis nicht schrittweise verbessern kann, in dem man nach der ersten Ziehung eine neue apriori-Wahrscheinlichkeit annimmt, bei der entweder 0 oder 3 weiße Kugeln ausgeschlossen werden, was im Nachhinein auch recht logisch erscheint. Hammer

Danke jedenfalls Huggy und sibelius84 für die zahlreichen Inputs! Wink
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von Schueler
Zitat:
Original von Huggy
Die einen würden sagen, wenn diese Wahrscheinlichkeiten nicht gegeben sind, dann kann man halt nichts rechnen.


Das sehe ich nicht so, schließlich kann man die sichere Aussage treffen, dass die Wahrscheinlichkeit (unter der Voraussetzung dass die Ziehungen jedesmal komplett gleich ablaufen), in meinem Beispiel zumindest nicht 0 und nicht 1 ist.

Das ist richtig. Es ergibt sich zwar auch rechnerisch aus dem Satz von Bayes, allerdings ganz unabhängig von der angenommenen priori-Verteilung, solange diese nicht im direketen Widerspruch zu dem Ergebnis der Stichprobe steht. Für den wesentlichen Teil der Rechnung braucht man eine priori-Verteilung für die noch logisch möglichen Urnenfüllungen.

Zitat:
Auch für die Werte dazwischen, wenn man nichts anderes hat, kann man doch zumindest und damit eine Wahrscheinlichkeit von 0,33 für nächste Kugel weiß schätzen.

Das ist aber eine Schätzung und keine Rechnung. Bei sehr kleinen Stichproben können solche Schätzungen stark von einer Rechnung abweichen. Nimm mal an, die Stichprobe hätte statt aus 10 gezogenen Kugeln aus nur einer gezogenen Kugel bestanden und diese wäre weiß gewesen. Dann würde diese Schätzmethode eine Wahrscheinlichkeit 1 ergeben, dass die nächste gezogene Kugel wieder weiß ist.

Zitat:
was auch mit der Simulation sehr gut übereinstimmt.

Für eine Simulation musst du doch eine priori-Wahrscheinlichkeit für die möglichen Füllungen der Urne annehmen und die ist ja gerade in der Aufgabe nicht gegeben.
Schueler Auf diesen Beitrag antworten »

Ganz verstehe ich nicht den Unterschied zw. Rechnung und Schätzung nicht. Die Rechnung ist, auch wenn mehr Informationen einfließen, ja immer noch eine Schätzung, da das Ganze ja auf einer Stichprobe basiert.

Das Problem bei kleinen Stichproben ist mir bewusst, allerdings habe ich mich schon immer gefragt ob Aussagen bei kleinen Stichproben in der Realität irgendwo sinnvoll sein könnten: entweder ich habe sehr gutes Vorwissen über mein Problem, so dass ich mir relativ sicher sein kann dass die Annahme meiner apriori Verteilung stimmt. Dann aber weiß ich vermutlich eh schon fast alles über das Problem. Oder ich weiß fast gar nichts (so stelle ich mir reale Fälle vor), dann kann ich bei kleinen Stichproben auch keine Aussagen mit einer sinnvollen Sicherheit treffen.

Bei allen Dingen die mir bis jetzt untergekommen sind (also Übungsbsp. ;-) ) wurde alles mit ausreichender Stichprobengröße erschlagen. Ich habe aber gelesen, dass irgendeine Theorie beim Brauen von Bier oder so entwickelt wurde, wo es tatsächlich nur kleine Stichproben gab. Ist interessant dass man da verwertbare Information rausholen konnte.

Die nichts gegeben war habe ich wie geschr. Gleichverteilung angenommen, damit ich etwas rechnen und dann mit Simulation prüfen kann. Danke nochmals für die Antworten!
HAL 9000 Auf diesen Beitrag antworten »

Ich will mal noch ergänzend anmerken, dass die Gleichverteilung

Zitat:
Original von Huggy

nicht die einzige sinnvolle a-priori-Verteilung sein muss. Wenn beispielsweise angenommen wird, dass jede der drei Kugeln bei der Urnenzusammenstellung mit Wkt 1/2 weiß oder schwarz war, und das unabhängig voneinander, dann würde man eher mit der Binomial-a-priori-Verteilung arbeiten, d.h.

.
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von Schueler
Ganz verstehe ich nicht den Unterschied zw. Rechnung und Schätzung nicht.

In der Statistik gibt es für unbekannte Parameter die Schätztheorie. Da gibt es Punktschätzer und Intervallschätzer und für beides gibt es mehrere Varianten. Die Verwendung solcher Schätzer und auf ihnen aufbauende Rechnungen habe ich als Schätzung bezeichnet. Unter Rechnung wollte ich Rechnungen verstehen, die nicht von solchen Schätzern ausgehen, sondern von Wahrscheinlichkeitsverteilungen der unbekannten Parameter.
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von HAL 9000
Ich will mal noch ergänzend anmerken, dass die Gleichverteilung

Zitat:
Original von Huggy

nicht die einzige sinnvolle a-priori-Verteilung sein muss. Wenn beispielsweise angenommen wird, dass jede der drei Kugeln bei der Urnenzusammenstellung mit Wkt 1/2 weiß oder schwarz war, und das unabhängig voneinander, dann würde man eher mit der Binomial-a-priori-Verteilung arbeiten, d.h.

.

Das ist natürlich richtig. Man kann sich diverse sinnvolle oder plausible priori-Verteilungen vorstellen. Das Anliegen der Bayesianer, zumindest der Objektivisten unter ihnen, besteht nun darin, ein Verfahren zu finden, das bei gegebenem Informationsstand zu einer nur von diesem Informationsstand abhängigen priori-Verteilung führt. Ich wage keine Aussage, wie überzeugend ihre Methoden da sind.

Für die gegebene Stichprobe führt deine priori-Verteilung zu derselben posterio-Verteilung wie die von mir angegebene.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »