Stichprobenumfang ermitteln für unbekannten Parameter in der GG

Neue Frage »

Daniel12 Auf diesen Beitrag antworten »
Stichprobenumfang ermitteln für unbekannten Parameter in der GG
Meine Frage:
Vor folgendem Problem stehe ich:
Ziel ist es aufgrund der Stichprobe eine Aussage über die Grundgesamtheit zu machen.
Konkret geht es darum, über einen Paramter x (nennen wir ihn Krankheit1) auf Grundlage der Stichprobe, deren Größe zu ermitteln ist, Aussagen über die Verteilung des Paramters x in der GG zu machen.
Die Größe der Grundgesamtheit beträgt 8 Mio. (um einfacher zu handhaben könenn wir auch gerne 1.000 annehmen).

Über den Paramter x (Krankheit1) lassen sich folgende Annahmen machen:
1. Man weiß nicht, wie x in der Gundgesamtheit verteilt ist.
2. Man kann davon ausgehen, dass x ungleich verteilt und nicht mit der gleichen Wahrscheinlichkeit auftritt wie diese Krankheit1 nicht zu haben (1-x).



Meine Ideen:
Ich bin mir bewusst, dass es hierbei um Paramterschätzung geht.
Wenn ich mich recht erinnere, kann ich aufgrund der o.a. Annahmen nicht mit Hilfe eines Konfidenzintervalls (Bonimalverteilung) rechnen?
Zellerli Auf diesen Beitrag antworten »

Moment...
Soll der "Parameter" nicht mehr und nicht weniger als die Wahrscheinlichkeit sein, dass ein zufällig ausgewählter Mensch das Attribut "Krankheit1" besitzt?

Dann ist es eine Binomialverteilung und du kannst den Stichprobenumfang so groß oder klein gestalten, dass du ein hinreichend enges Konfidenzintervall mit ausreichener Sicherheit erstellen kannst.

Also es könnte z.B. (frei erfunden) nachher herauskommen:
Du willst ein maximal ein Prozentpunkt breites Intervall aufstellen, in dem der echte Wert zu 95% liegt (Beispiel "zu 95% liegt die Wahrscheinlichkeit, dass ein zufällig ausgewählter Mensch Krankheit1 hat zwischen 31,0 und 33,0%") Dann könnte z.B. herauskommen:

Man muss 8000 Leute untersuchen um eine Aussage wie o.g. zu treffen.

Willst du sowas? Und ist damit auch der Parameter gemeint?
Daniel12 Auf diesen Beitrag antworten »

Zitat:
Original von Zellerli
Willst du sowas? Und ist damit auch der Parameter gemeint?


ja ganz genau. Wäre trotz der Annahmen eine Binomialverteilung richtig?
Gemäß dem Posting?
Repräsentative Stichprobengröße ermitteln
Zellerli Auf diesen Beitrag antworten »

Natürlich ist gerade wegen der Annahmen eine Binomialverteilung richtig. Lies ruhig mal die Definition, falls das noch nicht klar ist.

Ja, so wie im verlinkten Post kannst du es machen. Da wurde gleich mit der Normalverteilung angenährt.
Macht auch Sinn angesichts der Stichprobe (und ich setze mal voraus, dass erfüllt ist, also p nicht so gering ausfällt, dass es den großen Stichprobenumfang wettmacht).
Daniel12 Auf diesen Beitrag antworten »

endschuldige meine späte Antwort.

Wäre die folgende Rechung korrekt?
N = 6.000.000
k = 10.000
pn für den schlechtesten Fall = 0,25
\alpha = 0,05
p > 0,95


Für die Berechnung:



ergibt:



= 0,86 < 0,95

Damit müsste ich also eine größere Stichprobe als 10.000 nehmen, wenn ich mich an p > 0,95 halte?
Huggy Auf diesen Beitrag antworten »

Wenn N = 6.000.000 der Umfang der Grundgesamtheit sein soll und k = 10.000 der Umfang der Stichprobe, dann ist deine Rechnung falsch.

In das Konfidenzintervall für den Parameter p einer binomial verteilten Grundgesamtheit geht nur die Größe der Stichprobe ein, nicht aber die Größe der Grundgesamtheit. Das gilt, solange die Grundgesamtheit groß gegenüber der Stichprobe ist. Ist sie das nicht, muss man bei der Stichprobe von einer hypergeometrischen Verteilung ausgehen.

Bei deinen Zahlen ist die Näherung durch die Binomialverteilung gerechtfertigt und diese lässt sich wiederum bei diesen Zahlen durch die Normalverteilung annähern.

Ich nenne den Umfang der Stichprobe jetzt mal n anstatt k, also n = 10.000. Wenn in der Grundgesamtheit ein Anteil eine bestimmte Eigenschaft hat, dann haben in einer Stichprobe vom Umfang n im Mittel ca. n*p Individuen diese Eigenschaft. Die Standardabweichung dieses Mittelwertes



beträgt in der Näherung durch die Normalverteilung



Das 95 %-Konfidenzintervall ist dann

Das 95 %-Konfidenzintervall für p beträgt dann



Ist man also mit einer Genauigkeit des Ergebnisses von +- 1 % mit 95 % Sicherheit zufrieden, dann ist der Stichprobenumfang von n = 10.000 ausreichend.
 
 
Daniel12 Auf diesen Beitrag antworten »

ah vielen Dank.
Dann hatte ich nen Denkfehler drin.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »