Hypergeometrische Verteilung / Lotto |
| 24.05.2019, 13:46 | joeney | Auf diesen Beitrag antworten » | ||
| Hypergeometrische Verteilung / Lotto Das Problem bezieht sich auf eine Aufgabe meiner VL in Statistik und ist mit Excel zu lösen (was aber nebensächlich ist). Auszug aus der Aufgabenstellung: Bei einer Lotterie besteht ein Tippfeld aus 70 Zahlen. Ein Teilnehmer an der Lotterie kann selbst entscheiden, wie viele dieser Zahlen er ankreuzt (mindestens 2, höchstens 10) und welchen Betrag er einsetzt. Von den 70 Zahlen werden 20 Gewinnzahlen gezogen. Je nachdem, wie viele der Gewinnzahlen er angekreuzt hatte, bekommt der Lotterieteilnehmer einen festen Geldbetrag ausgezahlt. KENO-Gewinnquoten bei 10 getippten Zahlen (Anzahl richtig getippter Zahlen) - Feste Auszahlung je 1€ Einsatz 10 - 100.000 € 9 - 1.000 € 8 - 100 € 7 - 15 € 6 - 5 € 5 - 2 € 0 - 2 € a) Die Zufallsvariable X10 beschreibt den Gewinn eines Lotterieteilnehmers, der in einem Tippfeld 10 Kästchen ankreuzt und 2€ einsetzt. Berechnen Sie Erwartungswert, Varianz und Standardabweichung von X10. Ansätze: Grundsätzlich geht es um eine hypergeometrische Verteilung, allerdings beschreibt die Zufallsvariable X hier nun den "Gewinn" also in Euro. Beim ankreuzen von 10 Feldern gibt es ja 10 unterscheidbare Fälle. Für jeden dieser Fälle habe ich mir erstmal den Auszahlungsbetrag berechnet also z.B. G(10)=100.000€*2-2€ = 199.998€ im Fall von 10 richtigen usw... Die verschiedenen Zufallsvariablen X(1)-X(10) habe ich mir mit Excel ausrechnen lassen via der "Hypergeom.vert"-Funktion. Grundmenge N = 70 (Lotto-Zahlen) Menge Erfolge M = 20 (Gewinner-Zahlen) Stichprobenumfang n = 10 (angekreuzte Zahlen) Erfolg in Stichprobe k = 0,1,.. ,10 (richtig getippte Zahlen) Habe danach auch nochmal von Hand nachgerechnet (die Formeln sind ja kein Geheimnis..) und bin auf die selben Ergebnisse also X(0) bis X(10) gekommen, die die Wahrscheinlichkeiten der Fälle wiedergeben. SO: Zum Erwartungswert. Der wäre ja normalerweise Eigentlich ja nichts anderes als die Summe aus k * X da, also summiere ich: E(X) = k(0)*X(0) + k(1)*X(1) .... Um am Ende auf einen Geldbetrag zu kommen habe ich jetzt noch pro Summanden den Auszahlungsbetrag G, den ich mir in oben beschriebener Tabelle ausgerechnet habe multipliziert E(X) = k(0)*X(0)*G(0) + k(1)*X(1)*G(1) .... Liege ich mit meiner Rechnung hier richtig oder ist das schon der Holzweg? Ich bin mir nämlich nicht sicher, ob ich k mit G ersetzen soll oder ob G zusätzlich multipliziert wird? Ich würde auf zusätzliches Multiplizieren tippen, ich rechne ja in jedem Summanden nur die "normale" Wahrscheinlichkeit * Geldbetrag Bei der Varianz geht es dann ähnlich weiter allerdings bin ich hier noch verwirrter als ich gerne wäre.. Die Formel ist hier ja "nur": Wo bastel ich in der Varianz die Gewinnauszahlungen ein? Ich kann doch wieder sagen: V(X) = V(X1) + V(X2) + .... + V(Xk) Dann ist es z.B. für k=10: V(X10) = 10² * X(10) - E(X10)² und am Ende wird alles aufsummiert... aber wo schmeiß ich G rein? Die Teil-Lösungen meines Professors sind: Varianz von X10: ????5,77?? Standardabweichung von X10: ???,87?? An die Werte komme ich momentan mit all meinen Ansätzen aber nur ganz grob, d.h. irgendwo stimmt's bei mir auf gar keinen Fall.
Vielleicht hilft mir ja jemand, das ganze mathematisch besser zu verstehen
Danke im Voraus für alle Antworten!
|
||||
| 24.05.2019, 14:01 | HAL 9000 | Auf diesen Beitrag antworten » | ||
Für 1..4 Richtige gibt es keine Auszahlung (d.h. 0€), für 0 Richtige dann aber doch wieder 2€ - habe ich das so richtig verstanden? Macht in gewisser Weise auch Sinn, denn 0 Richtige ist unwahrscheinlicher als 1...4 Richtige. -------------------------------------------------------------------------------------- 1) Am besten trennst du das ganze inhaltlich sauber: Auf der einen Seite der Gewinn des Lotterieteilnehmers, auf der anderen Seite die Anzahl an richtig getippten Zahlen. Dann besteht hier der Zusammenhang (die "2" steht für die 2€ Einsatz) wobei den Gewinn für genau richtige Zahlen bei 1€ Einsatz bedeutet, also genau die Zahlen aus deiner Tabelle, ergänzt um . 2) "Die verschiedenen Zufallsvariablen X(1)-X(10)" ist für mich eine ziemlich seltsame Symbolik. Was du meinst, sind wohl die Wahrscheinlichkeiten dafür, dass du 1..10 richtige Zahlen hast. Das wird üblicherweise durch ausgedrückt. 3) Nächster Punkt Erwartungswert: Es ist mit , wobei hier ist. Es besteht der wegen KEIN linearer Zusammenhang zwischen und dem Anzahlerwartungswert . Bedauerlicherweise, denn das würde die Rechnung schön vereinfachen. 4) Varianz: Es ist , den hinteren Wert bekommst du von 3) und den vorderen von mit denselben wie in 3). |
||||
| 24.05.2019, 14:21 | Dopap | Auf diesen Beitrag antworten » | ||
Bleib doch vorerst mal bei a.) und was soll hier ? , und vor Allem ist keine Wahrscheinlichkeit. Sind Fragezeichen mit Absicht gewollt? |
||||
| 24.05.2019, 14:53 | joeney | Auf diesen Beitrag antworten » | ||
Hi HAL 9000, Danke für die schnelle Antwort! Und auch Dankeschön, dass du dir die Mühe gemacht hast, mein semi-mathematischen Wisch-Wasch hier überhaupt zu lesen. Ist ja nicht zu übersehen, dass das nicht meine Heimatwelt ist. Also auf 90% deiner Aussagen bin ich sogar selbst schon gekommen, hab's nur nicht drauf gehabt, das ganze korrekt im Forum zu kommunizieren. War mir trotzdem eine große Hilfe, denn deine Version ist erstens (in quantitativer Hinsicht) deutlich besser als meine riesigen Tabellen. Auch das einbinden von ist mir jetzt klarer, hab' ich vorher verbockt. Letztens war V(x) =E(X²) - (E(X))² besonders wichtig! Scheint entweder mein Prof (oder wahrscheinlich eher ich!) verschlafen zu haben.. damit bin ich jetzt auch auf meinen Fehler in Excel aufmerksam geworden, der mir ständig falsche Ergebnisse geliefert hat! Inzwischen stimmt alles mit den Teilergebnissen überein
Hat mich fast verrückt gemacht!
VIELEN DANK für die Hilfe! |
||||
| 24.05.2019, 16:13 | HAL 9000 | Auf diesen Beitrag antworten » | ||
@Dopap Es ist gemeint, die ganze Zeit. Für andere Ankreuzanzahlen benötigt man ja auch andere Auszahlungstabellen (d.h. genau genommen hätte ich da statt schreiben müssen). @joeney Ein Fauxpas ist mir noch unterlaufen (zumindest in der Beschreibung): Das , von dem ich die ganze Zeit geredet habe, ist nicht der Nettogewinn, sondern nur die Auszahlung der Lottogesellschaft. D.h., für den tatsächlichen Nettogewinn gilt (Abzug der 2€ Einsatz), mit der Folge , der Erwartungswert E(G) wird damit negativ (wie es sich bei einer Lotterie gehört). , d.h., die Varianz bleibt so. Alternativ könntest du für die Rechnung als -Tabelle die wirklichen Gewinnwerte nehmen, also (Anzahl richtig getippter Zahlen) - Fester Gewinn bei 1€ Einsatz 10: 99.999 € 9: 999 € 8: 99 € 7: 14 € 6: 4 € 5: 1 € 4: -1 € 3: -1 € 2: -1 € 1: -1 € 0: 1 € In dem Fall ist dann tatsächlich , weil die Fixkosten 1€ schon in den verarbeitet sind. |
||||
| 27.05.2019, 12:13 | joeney | Auf diesen Beitrag antworten » | ||
@HAL_9000 Der kleine Fauxpas ist mir auch schon aufgefallen, hätte ich aber auch innerhalb der Aufgabenbeschreibung betonen können. Hab' ich jedenfalls direkt in meiner Rechnung angeglichen, trotzdem Danke für die nachträgliche Korrektur!
An dich und die anderen Leser hätte ich vielleicht noch eine weitere Frage zu einer nachfolgenden Aufgabenstellung. Sie lautet: "Sie spielen an 16 Tagen, dabei kreuzen Sie jeden Tag in einem Tippfeld 3 Kästchen an. Ihr Einsatz beträgt jeden Tag 2 Euro. Wie wahrscheinlich ist es, dass Sie bei 16 Spielen mindestens 12-mal einen Verlust von 2 Euro haben?" (Tilergebnis meines Professors zur Kontrolle: 0,?14?) Bisheriger Lösungsansatz: Da ich schon bewiesen habe, dass korrekte mathematische Notationen nicht meine Stärke sind mache ich es dieses Mal von Anfang an umgangssprachlich. Beim Ankreuzen dreier Kästchen gibt es genau 4 Ereignisse. 1. Fall 0 Richtige = 0,3581 -> 2€ Verlust 2. Fall 1 Richtige = 0,4476 -> 2€ Verlust 3. Fall 2 Richtige = 0,1735 -> 0,00 Verlust/Gewinn 4. Fall 3 Richtige = 0,0208 -> 30€ Gewinn Diese Wahrscheinlichkeiten + Gewinn/Verlust habe ich vorher schon via Hypergeometrischer Verteilung berechnet und ich kann hier Fehler ausschließen. Mein Ansatz beruht auf der Grundlage einer Binominalverteilung. Ich kann in "Verlust" oder "Erfolg" zusammenfassen also: P(Verlust) = Fall 1. + 2. = 0,8056 P(Erfolg) = Fall 3. + 4. = 0,1944 Excel hat zufälligerweise eine Funktion für kumulierte Binominalverteilungen, die als Ergebnis die Wahrscheinlichkeit für höchstens k Erfolge unter n Versuchen liefert. Mindestens 12 Verluste (unter 16 Versuchen) = höchstens 4 Gewinne also sieht meine Excel-Funktion wie folgt aus: =1-BINOM.VERT(k;n;P;WAHR) mit BINOM.VERT(4;16;0,1944;WAHR) Die Funktion spuckt mir als Endwert 0,1852 aus (siehe Teilergebnis = 0,?14?) also.... falsch. Von Hand habe ich das noch nicht nachgerechnet, aber ich gehe momentan von der Richtigkeit Excels aus.. warum dann meine Frage wenn ich nicht mal selbst rechne? -> unter der Annahme, das Excel korrekt rechnet und mein Professor ebenfalls recht hat bleiben nur noch die Möglichkeiten offen, dass ich entweder schon unter ganz falschen Annahmen denke und es sich gar nicht um eine Binominalverteilung handelt oder dass ich irgendwo einen unglaublich idiotischen Schnitzer in meinem Lösungsweg habe (was ich nicht hoffe). Da es sich aber nur um 2 Ereignisse handelt, die 16 Lottospiele gleichartige Versuche sind und die oben berechneten Wahrscheinlichkeiten bereits die hypergeometrische Verteilung abdeckt, weiß ich nicht weshalb es keine Binominalverteilung sein sollte...
Vielleicht sieht ja jemand anders über den Tellerrand, ich tu's momentan offensichtlich nicht! |
||||
| Anzeige | ||||
|
|
||||
| 27.05.2019, 15:32 | HAL 9000 | Auf diesen Beitrag antworten » | ||
Ok, es geht um Zufallsgröße "Anzahl der Verlustspiele", und du sollst da bestimmen. Du rechnest nun lieber mit der Zufallsgröße "Anzahl der Gewinnspiele" (warum auch nicht), die ist binomialverteilt , und es besteht der Zusammenhang . Damit lautet die Rechnung , das entspricht doch genau der Vorgabe 0,?14?. Du nun hast stattdessen berechnet, um diesen Wert geht es hier aber nicht. Also ganz in Ruhe die Zusammenhänge überlegen, statt hastig loszurechnen.
"Idiotisch" würde ich den Fehler nicht nennen, sondern eher "klassisch": Statt der gesuchten wird die Gegenwahrscheinlichkeit ausgerechnet. Kommt sicher auch daher, dass man zu viele Dinge zugleich verarbeiten will: Übergang von "Verlustanzahl" zu "Gewinnanzahl", von zu und dabei den Überblick verliert, wie das wertmäßig zu verarbeiten ist. |
||||
|
|
Verwandte Themen
| Die Beliebtesten » |
| Die Größten » |
|
| Die Neuesten » |
|
