Konfidenzintervall Binomialverteilung

Neue Frage »

Dwee Auf diesen Beitrag antworten »
Konfidenzintervall Binomialverteilung
Hallo,

ich habe folgende Frage bezüglich des Konfidenzintervalls für einen unbekannten Anteilswert p:

Es gibt eine Urne, die z.B. [1,1,0,0,0,0,0,0,0,0] enthält, d.h. 2x die Eins und 8x die Null. Dieser Inhalt ist im Weiteren jedoch unbekannt.

Nun entnehme ich eine umfangreiche Stichprobe, z.B. n=400, zähle dann die erhaltenen Einsen und dividiere diese Zahl durch n um den Anteil p schätzen zu können.

Aus diesem Schätzwert berechne ich dann (in diesem Fall näherungsweise nach der Methode der Approximation einer Binomial- durch eine Normalverteilung), eine Untergrenze UG <= p <= Obergrenze OG mit einer Sicherheit von z.B. 0,95=95%.

Bedeutet das jetzt, dass wenn ich z.B. 1000 weitere Stichproben mit Umfang n=400 entnehme, und aus diesen jeweis 1000 Schätzwerte für p berechne, von diesen 1000 Werten ca. 950 im Bereich [UG; OG] liegen werden?

Vielen Dank für Hilfe!


Schöne Grüße, Martin
Huggy Auf diesen Beitrag antworten »
RE: Konfidenzintervall Binomialverteilung
Zitat:
Original von Dwee
Bedeutet das jetzt, dass wenn ich z.B. 1000 weitere Stichproben mit Umfang n=400 entnehme, und aus diesen jeweis 1000 Schätzwerte für p berechne, von diesen 1000 Werten ca. 950 im Bereich [UG; OG] liegen werden?

Nein!
Die Bedeutung des Konfidenzintervalls ist wie folgt:
Wenn du 1000 Stichproben entnimmst, bekommst du 1000 Konfidenzintervalle zur Sicherheit 0.95. Von diesen 1000 Konfidenzintervallen werden ca. 950 das wahre, aber unbekannte p, in deinem Fall 0.2, überdecken.
Helfer Auf diesen Beitrag antworten »
RE: Konfidenzintervall Binomialverteilung
Was Dwee gesagt hat ist schon richtig, das 0.95 KI überdeckt mit einer Wkt von 0.95 das wahre p.
D.h also wenn man nun eine große Zahl weiterer Stichproben zieht, und für jede dieser Stichproben einen Schätzwert für p berechnet, dann konvergiert der Anteil der Schätzwerte für p die in dem KI liegen für eine wachsende Zahl an Stichproben gegen 0.95.
Huggy Auf diesen Beitrag antworten »
RE: Konfidenzintervall Binomialverteilung
Nein, das ist genau falsch.

Wenn man eine Stichprobe zieht und daraus ein Konfidenzintervall bestimmt, kann es passieren, dass man eine ungünstige Stichprobe erwischt, die das wahre p nicht oder nur knapp überdeckt. Wenn man dann weitere Stichproben zieht und daraus Schätzwerte für p bestimmt, werden in diesem Fall weit weniger als 95 % der Schätzwerte in dem zu Anfang bestimmten Konfidenzintervall liegen.
Dwee Auf diesen Beitrag antworten »
RE: Konfidenzintervall Binomialverteilung
Hallo,

danke für die Antworten!

@Huggy: OK, hatte da einen Denkfehler, aber ich glaub jetzt hab ich die Bedeutung des KI verstanden. Freude

@ Helfer: Bedeutet das, wenn ich zum Bsp. 1000 Stichproben nehme, dann liegen zuerst z.B. 800 in meinem (einzigen, anhand einer ersten Stichprobe berechneten!) KI, bei 10000 z.B. schon 9000 und dann immer weiter Anteilsmäßig gg. 0.95?


Eine weitere Frage hätte ich noch, nämlich zur Gestalt der Wahrscheinlichkeitsfunktion des Konfidenzintervalls. Zur Erläuterung:

Habe ich eine Normalverteilung mit bekannter Varianz , dann ist die Wahrscheinlichkeitsfunktion für den wahren Mittelwert ja ebenfalls eine Normalverteilung, allerdings mit der Standardabw. .

Ist die Varianz unbekannt, dann ist die Wahrscheinlichkeitsfunktion etwas breiter t-Verteilt.

Habe ich eine Binomialverteilung wie in obigem Bsp. mit umfangreicher Stichprobe, ist die Wahrscheinlichkeitsfunktion für das unbekannte p näherungsweise ebenfalls normalverteilt.

Wie aber sieht diese Wahrscheinlichkeitsfunktion aus, wenn das Konfidenzintervall exakt berechnet werden soll (für eine kleine Stichprobe)? Lässt sich hier auch eine Verteilungsfunktion angeben?

Ich hoffe meine Beschreibung der Frage ist nicht zu unverständlich! Vielen Dank für Hilfe!

Schöne Grüße, Martin
Huggy Auf diesen Beitrag antworten »
RE: Konfidenzintervall Binomialverteilung
Zitat:
Original von Dwee
@ Helfer: Bedeutet das, wenn ich zum Bsp. 1000 Stichproben nehme, dann liegen zuerst z.B. 800 in meinem (einzigen, anhand einer ersten Stichprobe berechneten!) KI, bei 10000 z.B. schon 9000 und dann immer weiter Anteilsmäßig gg. 0.95?

Es ist egal wieviel Stichproben man anschließend zieht. Wenn die Anfangsstichprobe ungünstig war, bleibt der Anteil der Schätzwerte, die in diesem Konfidenzintervall liegen auch bei beliebiger Erhöhung der nachfolgenden Stichprobenzahl deutlich unter 95 %. Und wenn man eine günstige Stichprobe erwischt, bleibt der Anteil noch immer unter 95 %, nur halt weniger deutlich. Die 95 % erreicht man nur, wenn zufällig das Konfidenzintervall mit dem Prognoseintervall übereinstimmt. Die Wahrscheinlichkeit dafür ist 0.

Hypothesentests und Konfidenzintervalle werden häufig richtig berechnet aber falsch interpretiert.

Zitat:
Wie aber sieht diese Wahrscheinlichkeitsfunktion aus, wenn das Konfidenzintervall exakt berechnet werden soll (für eine kleine Stichprobe)? Lässt sich hier auch eine Verteilungsfunktion angeben?

Exakte Konfidenzintervalle lassen sich mittels der Beta-Verteilung, siehe hier:

http://de.wikipedia.org/wiki/Konfidenzin...rscheinlichkeit

oder alternativ mit der F-Verteilung angeben.
 
 
Dwee Auf diesen Beitrag antworten »
Nachtrag zur Konvergenz
Die erhaltenen Werte für p folgen ebenfalls einer Binomialverteilung (?), d.h. wenn mein einziges, zuerst berechnetes, KI nicht rein zufällig 95% dieser Binomialvert. einschließt, dann wird auch der Anteil der Schätzwerte für p nicht (d.h. auch im Allgemeinen nicht) konvergieren, oder?

Das mit Berechnung und Intepretation ist mir auch schon aufgefallen Augenzwinkern . Ehrlich gesagt fällt mir die Anwendung der Statistik schwer, weil die Formeln bzw. Verfahren (in meinen Anwendungen) verhältnismäßig einfach sind, aber man für richtige Anwendung echt ne Ahnung haben muss. Gleichzeitig wird das Thema recht schnell recht komplex.

Deshalb nochmals vielen Dank für die ausfühlichen Antworten, hat mir sehr geholfen! Freude
Huggy Auf diesen Beitrag antworten »
RE: Nachtrag zur Konvergenz
Zitat:
Original von Dwee
Die erhaltenen Werte für p folgen ebenfalls einer Binomialverteilung (?), d.h. wenn mein einziges, zuerst berechnetes, KI nicht rein zufällig 95% dieser Binomialvert. einschließt, dann wird auch der Anteil der Schätzwerte für p nicht (d.h. auch im Allgemeinen nicht) konvergieren, oder?

So ist es!

Konvergieren (im statistischen Sinne) wird er schon, aber nicht gegen 95 %, sondern gegen einen kleineren Wert, der davon abhängt, wo zufällig das zuerst ermittelte Konfidenzintervall liegt.
Dwee Auf diesen Beitrag antworten »
Schätzfunktion
Danke für den link zu wikipedia! Dort ist sehr gut angegeben wie man die Grenzen des exakten KIs berechnet; habe dies auch mit der F-Vert. auf einigen anderen Seiten im Netz gefunden. Was ich allerdings nicht finden kann ist eine Angabe für die Gestalt der Schätzfunktion, so wie z.B. zu einer Normalverteilung



die Schätzfunktion für den unbekannten Mittelwert bei bekannter Varianz ebenfalls eine Normalverteilung durch



mit standard-normalverteiltem U gegeben ist. Lässt sich so eine Schätzfunktion auch für eine exakte Binomialverteilung angeben?

Sorry dass ich nach fertigen Formeln frage; werde mich auch noch hinter ein ausführlicheres Statistiklehrbuch klemmen! Augenzwinkern
Huggy Auf diesen Beitrag antworten »
RE: Schätzfunktion
Zitat:
Original von Dwee
Lässt sich so eine Schätzfunktion auch für eine exakte Binomialverteilung angeben?

Ich rätsele, ob ich die Frage richtig verstehe. Nach meiner Interpretation der Frage ist doch die Binomialverteilung gerade die Schätzfunktion.

Ich betrachte mal die Normalverteilung und die Bernoulli-/Binomialverteilung im Vergleich. Man habe eine Zufallsgröße , die sei einmal nomalverteilt mit Parameter und das andere mal bernoulliverteilt mit Parameter . Nun ziehe man eine Stichprobe vom Umfang n aus den beiden Verteilungen. Diese Stichprobe wird repräsentiert durch n Zufallsgrößen , die alle identisch verteilt sind und unabhängig voneinander.

Jetzt kann man die Zufallsgröße betrachten. Die ist dann einmal wieder normalverteilt mit Parameter



das andere mal binomialverteilt mit Parameter .



Die Bernoulliverteilung ist identisch mit der Binomialverteilung für n = 1.

Der Übergang zu der Zufallsgröße



sollte nun kein Problem sein. Man muss lediglich beachten, dass bei einer stetigen Zufallsgröße sich dadurch die Dichtefunktion ändert, weil die Werte enger aneinander rücken, bei einer diskreten Zufallsgröße dagegen die Zähldichte unverändert bleibt, weil die Zahl der diskreten Werte sich nicht ändert.


Hoffentlich trifft das deine Frage. Vielleicht liest auch HAL 9000 mit. Der kann so etwas mathematisch präziser erklären und eventuell meine Ausführungen ergänzen oder korrigieren.
Dwee Auf diesen Beitrag antworten »
Schätzfunktion Binomialverteilung
OK, die einzelnen Werte der Stichproben sind natürlich so verteilt wie die Zufallsvariable. Die Schätzfunktion für einen Parameter (bspw. Mittelw. einer Normalvert.), ist dann ja ebenfalls eine Zufallsvariable (?), welche aber anders verteilt ist, bspw. bei einer Normalverteilung mit unbekannter Varianz ist die Wahrscheinlichkeitsfunktion für den Mittelw. dann ja t-Verteilt (bei bekannter Varianz stimmt ja der Typ der Verteilung überein, aber diese ist auch "enger" wegen dem Faktor Wurzel(n)).

Werde Zuhause versuchen das mit einem Funktionsplot leichter verständlich zu erklären! Vielen Dank jedenfalls fürs Durchlesen!
Huggy Auf diesen Beitrag antworten »
RE: Schätzfunktion Binomialverteilung
Zitat:
Original von Dwee
Die Schätzfunktion für einen Parameter (bspw. Mittelw. einer Normalvert.), ist dann ja ebenfalls eine Zufallsvariable (?), welche aber anders verteilt ist, bspw. bei einer Normalverteilung mit unbekannter Varianz ist die Wahrscheinlichkeitsfunktion für den Mittelw. dann ja t-Verteilt

Das ist nicht ganz richtig.
Auch bei einer Normalverteilung mit unbekannter Varianz ist die Teststatistik (Schätzfunktion) normalverteilt und keineswegs t-verteilt. Nur nützt einem das nichts zur Bestimmung eines Konfidenzintervalls für , weil man wegen der unbekannten Varianz die Quantile der Verteilungsfunktion nicht quantitativ angeben kann. Man benutzt daher in diesem Fall als Teststatistik die Größe , wobei s die Standardabweichung der Stichprobe ist. Diese Testgröße ist t-verteilt und die unbekannte Varianz von geht in ihre Verteilung nicht ein. Daher kann man mit ihrer Hilfe ein Konfidenzintervall für bestimmen. Bei der Binomialverteilung hat man diese Komplikation nicht. Die hat ja nur einen Parameter, nämlich p.

Es ist eine schöne Eigenschaft der Normalverteilung, dass eine Summe normalverteilter Größen wieder normalverteilt ist. Das gilt natürlich nicht generell für andere Verteilungen.
Dwee Auf diesen Beitrag antworten »
Verteilungen
Ja stimmt da hab ich einen Denkfehler, muss bei einer Stichprobe aus einer Normalverteilung natürlich auch normalverteilt sein, sollte ich aus der Definition erkennen, und wurde in meinem Lehrbuch auch extra hingewiesen. Um ehrlich zu sein habe ich nicht genau durchschaut wie die t-Verteilung entsteht, dies ist bei mir auch nicht genau erläutert. Jedenfalls habe ich mich an die Definition



gehalten. Daraus kann ich dann nach Umformung auf



mit t-verteiltem T mit n-1 Freiheitsgraden das KI abbilden. Als Bsp. habe ich dies in angehängtem gif für eine Normalverteilung und das KI eines samples dargestellt.

Ich bin nicht sicher ob die Vorgehensweise der Darstellung dieser Kurve so korrekt ist, aber jedenfalls ergibt das Integral nach separater Berechnung der Ober- und Untergrenze die geforderte Wahrscheinlichkeit.

Meine Frage im Zusammenhang mit der Binomialverteilung ist ob man eine solche Kurve auch für das KI des Anteils p angeben kann. Da handelt es sich dann wahrscheinlich um eine Betafunktion?
Huggy Auf diesen Beitrag antworten »
RE: Verteilungen
Zitat:
Original von Dwee
Meine Frage im Zusammenhang mit der Binomialverteilung ist ob man eine solche Kurve auch für das KI des Anteils p angeben kann. Da handelt es sich dann wahrscheinlich um eine Betafunktion?

Ja, mit Einschränkungen.

Für die einseitigen Konfidenzintervalle geht das. Die in der Wiki angegebenen Formeln für das exakte zweiseitige Konfidenzintervall der Binomialverteilung gelten auch für das einseitige Konfidenzintervall, wenn man durch ersetzt. Stellt man die Formeln von der inversen Betaverteilung auf die Betaverteilung um und schreibt die Betaverteilung als Integral über die Dichte der Betaverteilung hin, hat man genau das, was du suchst.

Für das zweiseitige Konfidenzintervall geht das nicht, weil die Binomialverteilung eine diskrete Verteilung ist. Bei einer diskreten Verteilung ist



Deshalb stehen für die Untergrenze und die Obergrenze des exakten zweiseitigen Konfidenzintervalls der Binomialverteilung leicht unterschiedliche Betaverteilungen in der Formel, die halt auch leicht unterschiedliche Dichteverteilungen haben. Bei stetigen Zufallsgrößen gibt es dieses Problem nicht.

Eine zweite Einschränkung betrifft die Interpretation dieser Dichte- bzw. Verteilungsfunktion. Formal macht das den Eindruck, als bekäme man so eine Dichte-/Verteilungsfunktion für den unbekannten Parameter. Da der unbekannte Parameter aber bei der klassischen Interpretation von Wahrscheinlichkeit keine Zufallsgröße ist, sondern eine zwar unbekannte, aber feste Größe, hat er im klassischen Sinne auch keine Dichte-/Verteilungsfunktion. Anders ist das bei der Bayesianischen Interpretation von Wahrscheinlichkeit. Das zu diskutieren würde aber ein Fass ohne Boden aufmachen.
Dweezil Auf diesen Beitrag antworten »
RE: Verteilungen
OK, jetzt versteh ich auch ein bischen besser warum für Ober- und Untergrenze verschiedene Parameter in der Betavert. verwendet werden.

Für jetzt weiß ich genug über Konfidenzintervalle, werde wenn Zeit ist lesen was die Bayesianische Wahrscheinlichkeit ausmacht.

Vielen Dank noch mal!

Schöne Grüße, Martin
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »