Wahrscheinlichkeit unbekannter Parameter

Neue Frage »

Kolbe Auf diesen Beitrag antworten »
Wahrscheinlichkeit unbekannter Parameter
Hallo, folgendes ist Sache: Urnenmodell: ich habe eine Urne mit Kugeln, darunter eine unbekannte Anzahl von weißen. Jetzt darf ich mal ne Probe von Kugeln nehmen, darunter sind 2 weiße. Daraufhin wird alles wieder in die Urne geschmissen.

Frage: wie hoch ist die Wahrscheinlichkeit, dass sich in der Urne genau weiße Kugeln befinden?

Mein Ansatz: offenbar gilt . Alles weitere? Kein Plan. Aber es muss doch möglich sein, die Infos meiner Stichprobe zu nutzen. Ich denk mal wenn ich meine 5 Kugeln auf die Gesamtheit 10 extrapoliere, sollte es doch wahrscheinlicher sein dass sich in der Urne 4 weiße Kugeln befinden als z.B. 7? Aber wie drückt sich das in Zahlen aus?!
HAL 9000 Auf diesen Beitrag antworten »

Die Frage ist unsauber gestellt:

Tatsächlich liegt hier ein Bayesscher Sachverhalt vor: Bei gegebener a-priori-Verteilung für die Anzahl der weißen Kugeln in der Urne kann man unter Berücksichtigung des Beobachtungsergebnisses "unter 5 gezogenen Kugeln waren 2 weiß" eine a-posteriori-Verteilung für berechnen.

Diese a-priori-Verteilung ist hier aber nicht gegeben, und ich sehe für die durchaus auch mehrere plausible Möglichkeiten, u.a. diese beiden:

a) Jede Kugel ist vorab mit jeweils 50% weiß und 50% andersfarbig. Dann ist die a-priori-Verteilung von die Binomialverteilung .

b) Die Anzahl ist a priori diskret gleichverteilt auf .

Je nach Modell kommt eine andere a-posteriori-Verteilung heraus. Gemeinsamkeit ist nur, dass aufgrund des Beobachtungsergebnisses die a-posteriori-Verteilung nicht mehr auf dem gesamten Spektrum verteilt ist, sondern nur noch auf - die Außenwerte 0,1,8,9,10 sind durch das Entnahmeergebnis "2 aus 5 sind weiß" bereits unmöglich geworden - soweit hast du das ja auch schon richtig festgestellt. Augenzwinkern


Am einfachsten zu rechnen ist Modell a), es ergibt sich letztlich wegen der dort herrschen Unabhängigkeit der Anzahl weißer Kugeln unter den gezogenen von der Anzahl weißer Kugeln unter den nicht gezogenen Kugeln die Verteilung .

b) ist trotz der (vermeintlich?) einfacheren a-priori-Verteilung schwieriger zu rechnen, hier muss wohl tatsächlich die Bayessche Formel ran.
Kolbe Auf diesen Beitrag antworten »

OK, im wikipedia ist ja fast genau das gleiche Beispiel angeführt, nur mit Binomialverteilung statt mit hypergeometrischer. Habs mit hyp.geom. durchgerechnet, komme bei gleichverteilter a-priori-Verteilung auf



Krass! Habe Satz von Bayes bis jetzt nur auf diese falsch/richtig positiv/negativ Testbsp. angewendet. Bleibt nur die Frage was man sinnvollerweise als a-priori-Verteilung annimmt. Außerdem geht mir nicht in den Kopf, ob der Parameter einer Verteilung jetzt immer ein deterministischer Wert ist oder auch mal als ZV aufgefasst werden kann. verwirrt
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von Kolbe
Außerdem geht mir nicht in den Kopf, ob der Parameter einer Verteilung jetzt immer ein deterministischer Wert ist oder auch mal als ZV aufgefasst werden kann. verwirrt

Das kommt darauf an! Big Laugh

Einfach ist die Sache, wenn ein zweistufiges Experiment vorliegt, bei dem zunächst nach einer bekannten Methode eine der 11 möglichen Urnenkonfigurationen ausgewählt wird und dann aus der gewählten Urne eine Stichprobe gezogen wird. Dann ist der unbekannte Parameter eine Zufallsgröße. Seine Verteilung ergibt sich aus der Auswahlmethode. HAL hat dafür zwei Beispiele genannt.

Problematisch wird es, wenn (a) die Methode nicht bekannt ist oder (b) gar keine Methode vorliegt, wenn also alles, was man weiß, ist, dass eine der 11 möglichen Urnenkonfigurationen vorliegt. Dann kommt es darauf, wie man den Wahrscheinlichkeitsbegriff in der realen Welt interpretiert.

Die Hauptinterpretation ist die einer relativen Häufigkeit in einer langen Versuchsserie, deren Problematik ich jetzt nicht diskutieren will. Das ist der frequentistische Standpunkt. Ich nenne es deshalb mal die F-Interpretation. Bei dieser Interpretation ist bei (a) der Parameter noch immer eine Zufallsgröße, aber über seine Wahrscheinkeit kann man nichts sagen, weil die a priori Verteilung nicht bekannt ist. Bei (b) ist der Parameter keine Zufallsgröße und hat deshalb per se keine Wahrscheinlichkeit. In beiden Fällen behilft sich die F-Interpretation mit Hypothesentests und Konfidenzintervallen.

Eine alternative Interpretation ist die Bayesianische Interpretation von Wahrscheinlichkeit. Ich nenne sie mal die B-Interpretation. Man kann diesen Wahrscheinlichkeitsbegriff beschreiben als ein Maß für die Plausibiltät (Evidenz) einer Aussage. Die mathematische Axiomatik bleibt dabei unverändert. Bei dieser Interpretation ist der unbekannte Parameter immer eine Zufallsgröße.

Das löst aber das Problem noch nicht. Man kann zwar jetzt immer den Satz von Bayes anwenden, braucht aber nach wie vor die a priori Verteilung. Es gibt bei der B-Interpretation zwar Konzepte zur Defintion einer a priori Verteilung bei vorheriger völliger Unwissenheit, aber nach meinem Kenntnisstand gibt es kein allgemein anerkanntes Konzept.
Kolbe Auf diesen Beitrag antworten »

Danke für die fetten Erklärungen! Freude

Anfangs hatte ich eigentlich ein anderes Konzept im Sinn: Bilde ein Konfidenzintervall mit z.B. Irrtumswahrscheinlichkeit. Dann kriege ich aus meiner Stichprobe recht enge Grenzen , innerhalb derer der Parameter mit einer Wahrscheinlichkeit von liegt. Dann berechne , mit , usw. Da ich beliebig viele Punkte konstruieren kann, versuche ich so die "Verteilung" meines gesuchten Parameters abzubilden.

Was ist davon zu halten? Aufgrund der beschriebenen Verständnisprobleme hinsichtlich Determinismus/Bayes hört sich die Methode sogar für mich krank an, und ich hab sonst keine Scheu alles zu verwenden was zum Ziel führt! Big Laugh
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von Kolbe
Was ist davon zu halten? Aufgrund der beschriebenen Verständnisprobleme hinsichtlich Determinismus/Bayes hört sich die Methode sogar für mich krank an, und ich hab sonst keine Scheu alles zu verwenden was zum Ziel führt! Big Laugh

Aus meiner Sicht führt kein Weg daran vorbei, dass du dich zunächst mal entscheiden musst, welche Interpretation von Wahrscheinlichkeit du hast bzw. akzeptabel findest: Die engere F-Interpretation oder die weitere B-Interpretation. Das ist keine mathematische Frage. Deshalb gibt es darauf auch keine mathematische Antwort.

Das Konfidenzintervall gibt nicht die Wahrscheinlichkeit für einen unbekannten Parameter an, noch nicht mal dann, wenn dieser Parameter im Sinne der F-Interpretation eine Zufallsgröße ist. Bei dem Konfidenzintervall ist die Zufallsgröße das Intervall und nicht der Parameter. Im Sinne der F-Interpretation liegt bei deinem Problem, wie HAL schon sagte, eine unzureichende Information vor. Ohne zusätzliche Informationen gibt es daher keine Antwort.

Die Bayesianer würden bei diesem Problem sehr wahrscheinlich als a priori Verteilung eine Gleichverteilung über die 11 möglichen Parameterwerte ansetzen. Wenn dir die B-Interpretation akzeptabel erscheint, kannst du das tun und dann mit der Bayes-Formel die a posterio Verteilung bestimmen.
 
 
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von Huggy
Die Bayesianer würden bei diesem Problem sehr wahrscheinlich als a priori Verteilung eine Gleichverteilung über die 11 möglichen Parameterwerte ansetzen. Wenn dir die B-Interpretation akzeptabel erscheint, kannst du das tun und dann mit der Bayes-Formel die a posterio Verteilung bestimmen.

Was kolbe oben ja schon getan hat. Augenzwinkern

Ich bin ein wenig verwirrt ob seiner letzten Beiträge, so als wolle er weiter nach der Quadratur seines Kreises (Bestimmung einer Verteilung von ohne weitere Voraussetzungen oder irgendwelche Annahmen machen zu müssen) suchen. verwirrt
Kolbe Auf diesen Beitrag antworten »

Zitat:
Ich bin ein wenig verwirrt ob seiner letzten Beiträge, so als wolle er weiter nach der Quadratur seines Kreises (Bestimmung einer Verteilung von X ohne weitere Voraussetzungen oder irgendwelche Annahmen machen zu müssen) suchen.


Nee, Kreis kann rund bleiben! Worum es mir eigentlich geht, ist das nachvollziehen dieser Rechnung: Size matters: Welche Auswirkungen n=400 auf die Schwankungsbreite hat (derstandard.at/1376534863944/Size-matters-oder-Welche-Auswirkungen-n400-auf-die-Schwankungsbreite-hat). Das Wesentliche daraus:

Zitat:
Schwankungsbreiten sind eine verkürzte Darstellung von Wahrscheinlichkeitsverteilungen. Eine Partei, die in einer Umfrage bei 20 Prozent liegt, würde bei Wahlen am wahrscheinlichsten bei 20 Prozent liegen, Werte darüber oder darunter sind auch möglich, jedoch umso unwahrscheinlicher, je weiter sie von 20 Prozent entfernt sind. Bei großen Parteien kommen die Verteilungen einer Gaußkurve sehr nahe, bei kleinen Parteien sind sie asymmetrisch.


Was meiner Meinung nach dort gemacht wurde: Die Wahrscheinlichkeit, dass die unbekannte tatsächliche Anzahl an Wählern von Partei XY in der Grundgesamtheit x Personen ist, wurde als Binomialverteilung mit den Parametern , bei Stichprobengröße und Zustimmungen angenommen. Bzw. bei passenden Voraussetzungen als Normalverteilung angenähert. Mit diesen hypothetischen Verteilungen werden dann Fragen beantwortet wie "wie hoch ist die Wahrscheinlichkeit dass Partei A mehr Stimmen bekommt als B?". Falls ich das richtig verstanden habe.

Eine andere Arbeit (stablab.stat.uni-muenchen.de/forschung/koala/methodik.pdf) hingegen geht genauso wie schon in der ersten Antwort vorgeschlagen wurde nach dem Prinzip von Bayes vor. Erscheint mir plausibler. Den ersten Ansatz kann ich nicht ganz nachvollziehen, ist halt auch nicht viel mathematische Erklärung dabei. verwirrt
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von Kolbe
Was meiner Meinung nach dort gemacht wurde: Die Wahrscheinlichkeit, dass die unbekannte tatsächliche Anzahl an Wählern von Partei XY in der Grundgesamtheit x Personen ist, wurde als Binomialverteilung mit den Parametern , bei Stichprobengröße und Zustimmungen angenommen. Bzw. bei passenden Voraussetzungen als Normalverteilung angenähert.

Nein, umgekehrt. Es wird angenommen, dass ein unbekannter Anteil p der Wähler für die Partei XY stimmt. Der Anteil der Wähler in der Stichprobe, die für diese Partei stimmen, ist dann hypergeometrisch verteilt und näherungsweise binomial verteilt und noch mal genähert normalverteilt. Aus dem Ergebnis der Stichprobe wird dann im Sinne der F-Interpretation ein Konfidenzintervall für den Parameter p gebildet. Dieses Konfidenzintervall wird dann häufig, obwohl man das bei der F-Interpretation streng genommen nicht darf, als Wahrscheinlichkeit für p interpretiert.

Zitat:
Eine andere Arbeit (stablab.stat.uni-muenchen.de/forschung/koala/methodik.pdf)

Den Link konnte ich nicht laden. Vielleicht liegt ein Schreibfehler vor.
Kolbe Auf diesen Beitrag antworten »

Ja da hab ich mich schlampig (falsch) ausgedrückt, meinte aber das selbe. Jedenfalls wird einfach aus dem und der Stichprobe eine Binomialverteilung, daraus eine Normalverteilung (zumindest bei hinreichend großem ) gebildet, und diese dann durch dividiert. Mehr sehe ich da nicht. Ist dies dann wirklich zulässig, um weitere Fragen zu beantworten (jetzt mal praktische Unzulänglichkeiten außer acht gelassen)?

Beim zweiten link fehlt ein w w w (muss mich noch registrieren damit ich links sauber posten kann) am Anfang, sorry. In der Arbeit gehts aber eigentlich nur darum, dass die vom Prinzip her genauso vorgegangen sind wie HAL_9000 anfangs vorschlug.

Danke auch für alle Antworten! Wink
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von Kolbe
Ist dies dann wirklich zulässig, um weitere Fragen zu beantworten?

Weshalb denn nicht? Es kommt natürlich auf die Fragen an!

Zitat:
Beim zweiten link fehlt ein w w w (muss mich noch registrieren damit ich links sauber posten kann) am Anfang, sorry. In der Arbeit gehts aber eigentlich nur darum, dass die vom Prinzip her genauso vorgegangen sind wie HAL_9000 anfangs vorschlug.

Die Autoren sagen explizit, dass sie mit Bayesianischer Statistik arbeiten. Rechentechnisch entspricht das dem von HAL beschriebenen Vorgehen. Allerdings betrachten sie alle Parteien gleichzeitig, wodurch aus der Binomialverteilung eine Multinomialverteilung wird. Und als priori-Verteilung verwenden sie keine der von HAL betrachteten Verteilungen sondern eine Dirichlet-Verteilung. Bei Betrachtung nur einer Partei ist das eine Betaverteilung.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »