Binomialverteilung mithilfe von Normalverteilung annähern

Neue Frage »

Maximo Auf diesen Beitrag antworten »
Binomialverteilung mithilfe von Normalverteilung annähern
Meine Frage:
Ich mache eine Präsentation in Mathe als Abiturprüfung und habe als Thema bekomen: "Erläutern Sie, wie und unter welchen Bedingungen eine Binomialverteilung mit Hilfe der Normalverteilung angenähert werden kann. Zeigen Sie Vor- und Nachteile der Normalverteilung auf.". Mein Plan war es, ein möglichst realitätsnahes Beispiel zu nehmen, welches sich dann durch die Präsentation hindurch fortsetzt und nur in den Variablen verändert wird. Ich hatte entschieden Die Produktion eines Gegenstands (z.B. Schrauben) als Beispiel zu nehmen, bei welcher ein gewisser Prozentsatz fehlerhaft ist. Ich hatte immer mit 10% gerechnet. Ich möchte zuerst eine einfache Rechnung mit einem kleinen "n" als Variable mithilfe der Binomialverteilung durchführen und diese dann erklären. Dann wollte ich ein sehr großes "n" nehmen um zu zeigen, dass dies mit der Binomialverteilung nicht möglich ist. Man also eine andere Möglichkeit braucht. Dann wollte ich dieses große "n" mithilfe der Normalverteilung lösen. Man würde erkennen, dass dies dann funktioniert. Als nächstes wollte ich das Ausgangsproblem, das kleine "n" mit der Normalverteilung lösen und dann vergleichen um zu zeigen, dass die Normalverteilung erst bei einem hohen "n" von nutzen ist, da Sie das Ergebnis sonst nicht annähert. Als nächstes wollte ich eine Tabelle zeigen mit unterschiedlichen "n"s um den Verlauf zu zeigen, dass die Normalverteilung, je höher das verwendete "n", immer mehr das Ergebnis annähert. Ich habe eine Faustformel gefunden welche die Bedingungen zeigen wann man mithilfe der Normalverteilung annähern kann. Diese lautet "np (1-p) ? 9". So sieht meine Gliederung aus. Ich habe nun einige "n" gelöst. Zuerst nur mit der Binomialverteilung. Ich habe es probiert mit 10,20,50,100,200 und bei 1000 war es nicht mehr möglich. Ich verwendete als "k" immer einen Wert der minimal über dem zu erwartenden Wert liegt. Daraufhin versuchte ich diese Variablen in die Normalverteilung einzusetzen. Bei den anfänglichen, kleinen "n"s lagen die Werte sehr weit auseinander was auch das Ziel war. Jedoch war an der Faustformel zu erkennen, dass ab dem Wert 100 als "n", es möglich sein sollte mit der Normalverteilung anzunähern. Jedoch fiel dann auf, dass die Ergebnisse bei einem sehr hohen "n" weiterhin sehr weit voneinander entfernt waren, und sich sogar weiter voneinander entfernten. Dafür finde ich keine Erklärung, da alle Rechnungen mit dem Taschenrechner gemacht wurden und die Werte dann aus den passenden Tabellen abgelesen wurden. Ich habe alles nochmal gecheckt und konnte keinen Fehler finden.
Ich hoffe ihr könnt mir helfen!

Meine Ideen:
Leider bin ich mit meinem Tacheles am Ende und weiß nicht ehr weiter :/
mamaheike Auf diesen Beitrag antworten »
RE: Binomialverteilung mithilfe von Normalverteilung annähern
Hallo maximo,

es wäre hilfreich, wenn Du ein konkretes Beispiel für dein Problem aufschreiben würdest.

Ich kann im Moment auch keinen Grund für diesen Effekt erkennen. Eventuell könnte ich an einem konkreten Beispiel aus deiner Präsentation nachvollziehen, wo der Fehler liegt.


denn ein Fehler muss es sein, das wäre nicht der Sinn der Approximation, dass es gerade bei großen n wieder große Abweichungen gibt.
maximo Auf diesen Beitrag antworten »
RE: Binomialverteilung mithilfe von Normalverteilung annähern
Hallo Mamaheike. Danke für die Antwort!
Als beispiel könnte man "n" 100 nehmen. Dies ist der grenzwert ab welchem man mit der Normalverteilung annähern kann, da die gennante faustformel erfüllt ist und auch das sigma 3 ist. Als "k" nehme ich 15. Wenn ich nun dieses n 100 mit der Binomialverteilung löse erhalte ich einen Wert welcher rund 0,33 ist. Wenn ich nun aber mit der Normalverteilung mein z herausfinde (1,66) lese ich in der Tabelle 0,9525. Sehr weit entfernt...
Hoffe dass du mir helfen kannst smile
mamaheike Auf diesen Beitrag antworten »
RE: Binomialverteilung mithilfe von Normalverteilung annähern
Hallo Maximo,

mit Sigma meinst Du wohl die Standardabweichung, welche auch bei Prüfung der Laplace Bedingung gebraucht wird.

Also Sigma = Wurzel aus (N*P*(1-P) muss > 3 sein

Ich würde das gerne nachrechnen, kenne aber dein P nicht.

Wenn Dein Sigma genau 3 ist, dann ist die Laplacebedingung nicht erfüllt, denn es sollte größer 3 sein.

N=100 ist nicht so viel, dass hier die Werte von der Binominalverteilung gut approximiert werden könnten.

Dass hier die Approximation nicht perfekt ist, ist verständlichh.

Trotzdem dürften die Abweichungen hier nicht so groß sein wie von Dir beschrieben. Ich tippe auf Ablesefehler in den Tabellen o.ä.

Ich brauche aber auch Dein P, um das nachrechnen zu können.
maximo Auf diesen Beitrag antworten »
RE: Binomialverteilung mithilfe von Normalverteilung annähern
Hi Mamaheike
Mein P hatte ich vergessen dazuzuschreiben. Ich rechne mit 0,1.
Okay, dass das sigma größer 3 sein muss hatte ich falsch gelesen danke schonmal dafür. Allerdings sollte wie schon gesagt die abweichung ja trotzdem nicht so extrem sein. Die tabelle habe ich ein paar dutzende male gecheckt also glaube ich nicht dass ich mich da verlesen habe...
mamaheike Auf diesen Beitrag antworten »
RE: Binomialverteilung mithilfe von Normalverteilung annähern
Hallo Maximo,

Dein Sigma und das Z sind richtig berechnet.
Das Ergebnis über die Binominalverteiung ist plausibel.


Ich hatte das Problem mit dem Ablesen der Normalverteilungswahrscheinlichkeit aus den Tabellen auch schon.

Hast Du die Möglichkeit, die Wahrscheinlichkeit über die Normalverteilung mit dem TR zu berechnen?

Wenn man das mit dem Taschenrechner rechnet, kommt man auf eine Wahrscheinlichkeit von 1,67% und das kommt hin, im Vergleich mit der Binominalverteilung.

P (x=15) = 1/Sigma * 1/ Wurzel(2*PI) * e ^-1/2*(z)^2 =1,67%

Also ich rechne eine nicht kumulierte Wahrscheinlichkeit bei der Normalverteilung immer mit dem TR, das Ablesen aus den Tabellen klappt hier nicht.

Warum weiß ich nicht,

Dagegen kann man eine kumuilierte Wahrscheinlichkeit aus der Normalverteilungstabelle ablesen. ((neg Z usw natürlich berücksichtigen)

Also das Probelm, welches ich auch schon hatte ist, dass man bei einer nicht kumulierten Wahrscheinlichkeit den Taschenrechner zur Berechnung nehmen sollte udn nicht die Tabelle.

Vielleicht weiß hier im Forum jemand den Grund.

Fazit: Deine Rechnungen sind richtig, lese den Wert aber nicht aus der Tabelle für die Normalverteilung ab sondern berechne ihn über den TR, dann kommts hin.
 
 
maximo Auf diesen Beitrag antworten »
RE: Binomialverteilung mithilfe von Normalverteilung annähern
Hi!
Ich glaube ich habe den Fehler gefunden. Mein gesamter Aufbau also das Experiment selber ist falsch. Ich werde jetzt zu diesem Experiment die Variable teta hinzufügen, durch einen Mitarbeiter der diese n 100 schrauben aus einer gewissen anzahl an produzierten schrauben herausnimmt. dann werde ich das experiment ganz neu aufbauen müssen. Glaubst du, dass da irgendwo der fehler liegen könnte und das sinn macht? Finde es echt super übrigens das du mir hier so hilfst und danke dir total dafür! Gott
mamaheike Auf diesen Beitrag antworten »
RE: Binomialverteilung mithilfe von Normalverteilung annähern
Hallo Maximo,

dein Experiment ist binominalverteilt, wenn es zwei Ausgänge gibt (kaputt/nicht kaputt z.B.) udn wenn die Wahrscheinlichkeit P auf jeder Stufe gleich ist.

Diese Bedingungen scheinen mir bei deinem jetzigen Experiment bereits gegeben zu sein, wenn ich das richtig verstanden habe.

Übrigens hatte ich mich verlesen bei deinem Ergebnis für die Binominalverteilung, Du hast 0,33 geschrieben, also 33%, ich hatte 3 % gelesen. 3 % würden passen zu den 1,67 % , die ich bei der Normalverteilung über den TR berechnet habe, 33 % aber nicht.
Ich rechne die Binominalverteilung auch nochmal mit dem TR nach.

Das mit der neuen Variablen teta verstehe ich nicht, das scheint mir unnötig.

Du hast ja eine sehr große Grundgesamtheit (alle produzierten Schrauben) davon nimmst Du N Schrauben raus, also zB. N=100 in unserem Beispiel.

Davon sind k Schrauben kaputt mit einer Wahrscheinlichkeit von 0,1.

Wenn Du wissen willst, mit welcher Wahrscheinlichkeit bei einer Entnahme von 100 Schrauben 15 davon kaputt sind, kannst Du das über die Binominalrechnung berechnen, so wie Du es schon gemacht hast.

Da braucht man keine Variable Teta. Meiner Meinung nach liegt das Problem nur am Ablesen aus den Tabellen.
mamaheike Auf diesen Beitrag antworten »

Hallo maximo,

ich denke, ich bin doch auf dem richtigen Weg.

Ich habe eben mit dem TR deinen Binominalwahrscheinlichkeit nachgerechhnet, es kommt tatsächlich 0,0326 raus, also 3,26 %

Und das passt sehr gut mit den 1,67% raus, die ich für die wahrscheinlichkeit nach der Normalverteilung berechnet habe.

Rechne also nochmal diene Binominalwahrscheinlichkeit nach:

(100 über 15) * 0,1 ^15 * 0,9 ^(85)

Es kommt 3,3 % raus (nicht 33%)


Und dann rechne die Wahrscheinlichkeit über die Normalverteilung mit dem TR (kannste auch Schrittweise rechnen, wenn der TR nicht alles auf einmal schafft)

Hier kommt 1,67 % raus und das passt.
maximo Auf diesen Beitrag antworten »

Hi ja wollte grade auch schreiben, dass ich beim nachrechnen auch auf 3% prozent gekommen bin allerdings hatte ich das so verstanden, dass diese 1,67 nur "z" sind, und ich diesen dann noch in der Tabelle nachsehen muss. Oder wann braucht man sonst die Tabellen?
opi Auf diesen Beitrag antworten »

Die Annäherung über die Normalverteilung liefert ebenfalls einen Wert von 3,3%. smile

Es muß die WSK für das Intervall von 14,5 bis 15,5 Schrauben bestimmt werden. (Also zwei Werte in der Tabelle nachschlagen! Die WSK für einen einzelnen Wert ist bei der Normalverteilung immer Null.
mamaheike Auf diesen Beitrag antworten »

Hallo,

diese 1,67 % sind nicht Z. Zufällig sind die Zahlen ähnlich. Dein Z war ja 1,66.

Die 1,67 % sind das Ergebnis für die Wahrscheinlichkeitsberechnung über die Normalverteilung, dieses Ergebnis ist aus Zuflall Z ähnlich.

Die Tabellen braucht man, um die kumulierten Wahrscheinlichkeiten zu berechnen, also z:B.

Du nimmst n=100 heraus, wie groß ist die Wahrscheinlichkeit, höchstens 15 schlechte Schrauben zu bekommen.

Also nicht genau 15 schlechte Schrauben, wie in Deinem Beispiel, sondern z.B. höchstens 15.

Das nennt man kumulierte Wahrscheinlichkeiten.

Dann kannst Du das z berechnen und in den Tabellen nachschauen. Das klappt nach meinen Erfahrungen.

Wenn Du allerdings keine kumulierte Wahrscheinlichkeit hast, musst Du den TR zur Berechnung nehmen. Den Grund kenne ich selber nicht.

Vielleicht kann hier jemand aus dem Forum helfen.
mamaheike Auf diesen Beitrag antworten »

Hallo opi,

langsam kommen wir der Sache näher. Das Gaussche Integral ist ja die Fläche. Es ist logisch, dass die WSK für einen einzelnen Wert eigentlich immer Null ist, da, wenn man das untere Intervall vom oberen abzieht, eigentlich nichts über bleibt.

Also müsste tatsächlich vom oberen Wert der Untere abgezogen werden, trotzdem ist es doch etwas willkürlich, als Grenzen 14,5 und 15,5 zu nehmen.

Warum nimmt man nicht 14,9 und 15,1 z B.

Und warum lässt sich das mit dem Taschenrechner berechnen? Wie macht der das?

OK aber die Frage, warum man hier nicht einfach einen Wert aus der tabelle ablesen kann, ist hiermit schon mal geklärt. Freude
maximo Auf diesen Beitrag antworten »

WOW! jetzt wenn ich meine notizen durchsehe wird das alles viel klarer und ich denke ich habe gefunden wann ich angefangen habe alles zu verdrehen. Das heißt Ich muss einfach nur die Variablen in die standardnormalverteilung einsetzten und das mit dem TR lösen und das wars?! geschockt
maximo Auf diesen Beitrag antworten »

wenn ich das richtig verstanden habe nimmt man für die grenzwerte den oberen k wert + 0,5 und den unteren k wert - 0,5 da ich ja nur ein k habe würde 14,5 und 15,5 in dem fall sinn machen! da aber nicht ich hier der große mathematiker bin ist das wahrscheinlich auch nicht unbedingt richtig...
opi Auf diesen Beitrag antworten »

@mamaheike:
Ganz so willkürlich ist es nicht. 14 Schrauben gehen von 13,5 bis 14,5; 15 Schrauben dann direkt anschließend von 14,5 bis 15,5 u.s.w. So wird die gesamte Fläche lückenlos und gerecht abgedeckt. Das Stichwort lautet Stetigkeitskorrektur, siehe auch bei Wiki

@maximo: Die Gedanken in Deinem zweiten Post sind richtig, den ersten Post habe ich nicht verstanden.
mamaheike Auf diesen Beitrag antworten »

Hallo Maximo,

das mit den +0,5 und. den - 0,5 könntest Du anwenden, um dann die Werte aus der Tabelle ablesen zu können.

Dank opi weiß ich nun, warum.

Du musst dann zwei Z ausrechnen, einmal halt mit +0,5 und einmal mit -0,5.

Die Wahrscheinlichkeiten liest Du ab aus der Tabelle und subtrahierst sie voneinander und Bingo !!!


Eine Frage bleibt für mich noch offen, da ich den TR gerne benutze: verwirrt

Wenn ich die entsprechenden Variablen für das Gaussche Integral in den Taschenrechner eingebe (ohne diese 0,5 en), dann erhalte ich einen Wert, in dem Fall diese 1,67%

Ist dies nun genauer als die Methode über die Tabelle (da ich dort ein Intervall habe), oder ist eine Berechnung über den Taschenrechner generell nicht möglich?
mamaheike Auf diesen Beitrag antworten »

@opi

Die Konsequenz aus deinem letzten Post bedeutet, dass man den TR zur Berechnung der WSK über die Normalverteilung nicht einsetzten kann.

ok, wieder was gelernt Big Laugh
maximo Auf diesen Beitrag antworten »

@opi
naja ich habe es mir anscheinend bisher ziemlich umständlich gemacht und viele sachen zusätzlich gemacht die extra arbeit waren aber mich letzten endes sogar zu was falschem geführt haben. deswegen wollte ich nur noch die bestätigung, dass ich einfach die werte welche zu hoch für die binomialverteilung sind, in die standardnormalverteilung einsetzen muss?
maximo Auf diesen Beitrag antworten »

Mathe macht mich fertig.. Ich bin nurnoch verwirrt... Erstaunt2
mamaheike Auf diesen Beitrag antworten »

@Maximo

Es ist jetzt eigentlich alles klar.

Du hast es schon richtig geschrieben.

Wenn Du eine WSK für genau 15 Schrauben willst, dann berechnest Du zwei verschiedene Z

Einmal das Z = (k-E(x) +0,5)/Sigma und dann noch das Z= (k - E(x) -0,5)/ Sigma
dann schaust Du in der Tabelle nach und subtrahierst die beiden Werte voneinander.

Dann bist Du auf der sicheren Seite.

Ich hatte die Variablen einfach in das Gaussche Integral eingesetzt und per TR gerechnet.

1/Sigma * 1/wurzel(2PI) * e ^-1/2 * (z)^2

Aber es istwohl genauer, sich diese zwei Z auszurechnen, und dann in der Tabelle nachzuschauen.
maximo Auf diesen Beitrag antworten »

Super! Dann habe ich denke ich wohl doch endlich den durchblick! Ich danke euch beiden und werde versuchen jetzt nochmal alles zu machen! kann nur wiederholen wie gut ich es finde wie ihr euch hier bemüht für andere Leute Freude
opi Auf diesen Beitrag antworten »

Hilfreich kann auch die hervorragende Webseite von Arndt Brünner sein.
Hier kannst Du Deine Ergebnisse der Normalverteilung kontrollieren und auch bei einem hohen Wert für n die Binomialverteilung zum Vergleich betrachten.
mamaheike Auf diesen Beitrag antworten »

@Maximo

Viel Glück bei deiner Präsentation , ich bin auch froh, dass es dieses Forum gibt.
maximo Auf diesen Beitrag antworten »

@ opi: Danke! Sehr nützlich zum absichern!

@ mamaheike: Ich hoffe das beste aber jetzt steht der sache ja nichts mehr im weg smile
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »