Urnenmodell mit Zurücklegen

Neue Frage »

silvernsnake Auf diesen Beitrag antworten »
Urnenmodell mit Zurücklegen
Meine Frage:
In einer Urne liegen 75 nummerierte äusserlich gleiche Kugeln.
Nach jeder Entnahme einer Kugel, wird diese wieder zurückgelegt.
Es werden insgesamt 10 Kugeln entnommen.

Kann man und wenn ja wie, berechnen, wie viele Kugeln mehrfach gezogen werden (ob doppelt oder x-fach wäre egal).
Kann man dies in eine Formel, ggf. auch Excelformel bringen.

Meine Ideen:
Alle Versuche es mit Permutationen, Kombinationen oder Variationen zu machen schlugen fehl oder ist es gar so, dass dies nur durch das Abzählen bestimmter Häufigkeiten und Vergleich mit allen denkbaren Häufigkeiten möglich wäre?
Vielen Dank
willyengland Auf diesen Beitrag antworten »

Ich weiß es nicht, vermute aber, dass es eine Formel gibt.
Ich würde so vorgehen, dass ich mit kleinen Kugelmengen anfange, also erst 3, dann 4, 5 usw. und die Möglichkeiten notiere.
Dann gucken, ob man ein Muster erkennt.
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von silvernsnake
Kann man und wenn ja wie, berechnen, wie viele Kugeln mehrfach gezogen werden (ob doppelt oder x-fach wäre egal).

Diese Anzahl ist eine Zufallsgröße, und natürlich kann man deren Verteilung auch bestimmen - allerdings eben nicht in einer einfachen "summenfreien" Formel.

---------------------------------------------

Ok, sagen wir Kugeln in der Urne, werden entnommen mit Zurücklegen, und kennzeichne die Anzahl der verschiedenen Kugeln, von denen jede einzelne mindestens zweimal unter den entnommenen Kugeln vorkommt.

Derartiges "Ziehen mit Zurücklegen" findet in einem Laplace-Raum der Mächtigkeit statt. So ist



denn da müssen alle entnommenen Kugeln voneinander verschieden sein (siehe Geburtstagsproblem). Kommen wir zu genau einer mehrfach vorkommenden Kugel. Dieses "mehrfach" kann von bis sein:



Erklärung: Es gibt Möglichkeiten für die Auswahl der einen Kugel, die -mal vorkommen soll. Es verbleiben Kugeln zu entnehmen aus der Restmenge von Kugeln, jede darf nur genau einmal vorkommen. Zum Schluss muss diese Menge von Kugeln ( Kugeln genau einmal, eine genau -mal) noch permutiert werden.

Ist also bereits ziemlich eklig, für usw. wird es noch schlimmer...


Nur am Ende entspannt es sich etwas: Maximalwert für ist , da lautet die Rechnung

a) für :

b) für :

Was noch einigermaßen "vernünftig" zu berechnen geht, ist der Erwartungswert: Es ist , wobei die Indikatorvariable kennzeichnen möge, dass Kugel mindestens zweimal vorkommt. Damit ist mit

, d.h.

Für und bedeutet letzteres , und die Wahrscheinlichkeitswerte



.

Ich hoffe mal, ich hab mich nicht verrechnet, war ein rechter "Schnellschuss". Augenzwinkern
Dopap Auf diesen Beitrag antworten »

Wohlwissend hab' ich gleich die Finger davon gelassen. Augenzwinkern , da hätte mir auch ein Zeitlupenschuss nicht wirklich geholfen.
Für Schulmathematik eine doch deftiges Problem Augenzwinkern ob der Fragesteller sich dessen bewusst ist ??
HAL 9000 Auf diesen Beitrag antworten »

Ok, hier dann doch noch die allgemeine Wahrscheinlichkeitsformel. Wie versprochen ein wahres Monster:

,

dabei ist das , über das hier summiert wird, ein -dimensionaler Multiindex aus der Menge

.

Die Formel sollte für alle stimmen, für ergibt sich automatisch und damit . Augenzwinkern


EDIT: Mit der (für manche vielleicht exotisch wirkenden) Zusatzfestlegung , d.h., diese Multiindexmenge enthält genau einen "leeren" Multiindex, stimmt die Formel sogar auch für .
Dopap Auf diesen Beitrag antworten »

ich nehme an, dass diese geschlossene Formel doch recht theoretischer Natur ist. Die Bedingung an den Multiindex

ist nicht sehr praktikabel.
 
 
HAL 9000 Auf diesen Beitrag antworten »

Erstaunt1

Die Formel ist praktikabel genug, um bis ca. n=40 in erträglicher Zeit mit einem MuPad-Skript die exakten Wahrscheinlichkeiten auszurechnen, und das für alle . Und bei allem Misstrauen, die ich meinen eigenen Betrachtungen gegenüber hege: Die Kontrollsumme über alle r ergab stets 1. Augenzwinkern

code:
1:
2:
3:
4:
5:
6:
7:
8:
9:
10:
11:
12:
13:
14:
15:
16:
17:
18:
19:
20:
21:
22:
23:
24:
25:
26:
27:
28:
29:
30:
31:
32:
33:
34:
35:
36:
37:
38:
39:
40:
41:
42:
prob := proc(m,n,r)
local f,i,j,k,s,t ;
begin
  s:=0 :
  t:=n-2*r :
  if (t>=0) then
    for i from 1 to r do
      k[i]:=2 :
    end_for:
    j:=1 :
    while ((j>0) and (t>=0)) do
      f:=1 :
      j:=1 :
      for i from 2 to r do
        if (k[i]=k[i-1]) then
          j:=j+1
        else
          f:=f*j! :
          j:=1 :
        end_if 
      end_for :
      s:=s+binomial(m-r,t)/(f*j!*_mult(k[i]! $ i=1..r)) :
      j:=r :
      while (j>0) do
        k[j]:=k[j]+1 :
        t:=t-1 :
        if (t>=0) then
          break
        end_if :
        j:=j-1 :
        f:=k[j]+1 :
        for i from j+1 to r do
          t:=t+k[i]-f :
          k[i]:=f :
        end_for :
      end_while 
    end_while 
  end_if :
  binomial(m,r)*n!*r!*s/m^n
end_proc :

plist := prob(75,10,r) $ r=0..5 ; _plus(plist)
Dopap Auf diesen Beitrag antworten »

na ja, praktikabel ist natürlich relativ, z.B für meinen TR-Interpreter . Das Mupad Programm gefällt mir gut, erinnert an Turbo-Pascal. Schön, dass die ENDs auch klar machen zu welchem Block das gehört.
Zum Programmieren in den TR in RPN- Logik seh' ich nur ein Problem:

  • was genau macht der Befehl BREAK ?


in RPN gibt es keine Sprünge.
HAL 9000 Auf diesen Beitrag antworten »

"break" verlässt die unmittelbar nächste äußere while/for-Schleife - im vorliegenden Fall bewirkt das "break" in Zeile 28 einen Sprung zu Zeile 37, d.h. das "end_while" in Zeile 36 wird übersprungen, das in Zeile 37 aber nicht! Ist genau wie in C.

Kann man auch anders lösen, sicher.

Ich verstehe aber immer noch nicht, warum die Formel angeblich nicht praktikabel sein soll.


P.S.: Das Skript enthält noch folgende Berechnungsreduktion:

Der Summand hängt ja nicht von der Reihenfolge der Werte ab, sondern nur von den Werten selbst (unter Berücksichtigung evtl. vorhandener Vielfachheiten). D.h., es reicht aus über



zu summieren, man muss aber dann jeden der Summanden mit einem passenden Faktor zu versehen:

D.h., wieviele Tupel aus gehören zu einem konkreten Tupel aus ?

Diese Frage ist leicht beantwortet: Unter den Werten mögen verschiedene sein in den Vielfachheiten . Es ist dann also und der gesuchte Faktor ist .

Beispiel: Zu dem einen Tupel gehören Tupel in , die den selben Summanden in der Originalsumme liefern, das sind konkret (2,2,3,3), (2,3,2,3), (2,3,3,2), (3,2,2,3), (3,2,3,2) und (3,3,2,2).


EDIT: Ach ja, zur Mächtigkeit von hatte ich oben gar nichts geschrieben:

Sie entspricht der Anzahl aller nichtnegativen -Tupel mit Summe , und die wiederum der Anzahl aller nichtnegativen -Tupel mit Summe , das wäre . In unserem Fall bedeutet das für die Mächtigkeiten für die Werte 1,9,28,35,15,1. Die entsprechenden Werte für sind 1,9,16,11,4,1. Soweit, so unspektakulär.

Bei sieht die Sache indes schon anders aus: Dort man bei das Maximum Summanden. Da zahlt sich die Reduzierung der Summanden in gegenüber schon aus, es sind dann nur noch (im Algorithmus "mitgezählt") Summanden zu betrachten.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »