Stichprobenumfang

17.05.2007, 02:54

Stichprobenumfang

Hallo ihr Könner,
ich habe ein Verständnisproblem mit dem sog. Stichprobenumfang,
vielleicht könnt und wollt ihr mir ja helfen!?
Also:
Es geht um eine Grundgesamtheit von 8000 Stk. (Autos von mir aus).
Ein gewisser unbekannter Anteilswert von ihnen ist geschädigt und muss repariert (zurückgerufen) werden.
Wieviel Stk. (Autos) muss ich als Stichprobenumfang untersuchen, um mit 99%iger Sicherheit auf die Schädigung der Grundgesamtheit schließen also hochrechnen zu können, wieviel Stk. insgesamt geschädigt sind?
Vielen Dank!
MfGMN

17.05.2007, 06:58

Auf diesen Beitrag antworten »

RE: Stichprobenumfang
Grundgesamtheit vs. verkleinertes Abbild - Mindestumfang Zufalls-Stichprobe

19.05.2007, 07:46

Auf diesen Beitrag antworten »

RE: Stichprobenumfang
Hallo Arthur,
danke, aber verstanden habe ich es noch nicht!
Gibt es eine Formel in der ich:

Grundgesamtheit N=8000
Konfidenzintervall: 95%
Varianz: 5%

einsetzen und den Stichprobenumfang (n) berechenen kann?
MfGMN

19.05.2007, 08:16

Auf diesen Beitrag antworten »

Nein, die gibt es nicht - zumindest nicht in so einfacher Form wie du es wünschst.

Es gibt eine Näherung basierend auf der Normalverteilungsapproximation. Für die ist die Grundgesamtheitsgröße allerdings unerheblich, also ob nun N=8000, N=8000000 oder N=unendlich ...

19.05.2007, 08:25

Auf diesen Beitrag antworten »

Stichprobenumfang
...das verstehe ich nun gar nicht mehr.
Es muss doch eine Rolle spielen,
ob ich von 8000 Stk. spreche oder von 800.

Habe ich bspw. 400 Stk. unetrsucht, wären das 5% von 8000 aber 50% von 800. Also wäre doch meine Hochrechnung auf die Grundgesamtheit von viel größerer Wahrscheinlichkeit.!?

19.05.2007, 09:59

Auf diesen Beitrag antworten »

Zitat:

Original von MN
...das verstehe ich nun gar nicht mehr.
Es muss doch eine Rolle spielen,
ob ich von 8000 Stk. spreche oder von 800.

Tja, dann hast du den verlinkten Thread nicht durchgelesen - deine Schuld. Ich wiederhole nicht alles nochmal von vorn.

Aber doch nochmal das wesentliche für die faulen Leser:

Die Grundgesamtheit spielt schon eine Rolle, wenn man exakt rechnet, wie ich es hier vorgerechnet habe, mit dem hypergeometrischen Modell. Für große, besser gesagt sehr große $\begin{eqnarray*} N \end{eqnarray*}$ kann man aber das hypergeometrische durch das Binomialmodell, und dieses wiederum durch das Normalverteilungsmodell approximieren - nur durch diese Vereinfachung (aber mit einem gewissen Approximationsfehler) ergeben sich einfache Formeln für den notwendigen Stichprobenumfang. Diese vereinfachten Formeln wiederum hängen aber nicht mehr von $\begin{eqnarray*} N \end{eqnarray*}$ ab, es kann bei unbedachter Anwendung dann sogar zu solch absurden Ergebnissen kommen, dass ein Stichprobenumfang $\begin{eqnarray*} n>N \end{eqnarray*}$ ausgerechnet wird ... spätestens dann ist klar, dass die Approximation Murks war, also nicht zu gebrauchen.

Die auf Normalverteilungsapproximation basierende (und von N unabhängige) Schätzung basiert auf dem Konfidenzintervall für den "Anteilswert einer dichotomen Grundgesamtheit" ( Übersichtstabelle in Wikipedia, letzte Zeile ).

19.05.2007, 13:52

Auf diesen Beitrag antworten »

....und von folgender Formel ist nichts zu halten?
(wohl nach Bernd Leiner "Stichprobentheorie")

n = (N * k^2 * s^2) / (d^2 * (N-1) + k^2 * s^2)

mit
N=8000 (Grundgesamtheit(
k=1,96 (statistische Sicherheit von 95%)
d=0,05 (Stichprobenfehler von 5%)
s^2 = p*(1-p) = 0,5*(1-0,5) = 0,25

dann wärer n = 366,6 und würde gut zu meiner Arbeit passen.
MfGMN

19.05.2007, 14:29

Auf diesen Beitrag antworten »

Na dann nimm sie doch - ich kenn sie nur eben nicht. Jedenfalls

Zitat:

Original von MN
k=1,96 (statistische Sicherheit von 95%)

ist das ein Indiz, dass hier auch mit Normalverteilungsapproximation gearbeitet wird.

Ich verstehe allerdings nicht ganz, was du mit "Stichprobenfehler" meinst: Soll das die maximale Konfidenzintervallbreite (bzw. eher halbe Breite) sein? In dem Fall wäre Stichprobenfehler die falsche Bezeichnung.

19.05.2007, 15:57

Auf diesen Beitrag antworten »

Ja Arthur,
k=1,96 (statistische Sicherheit von 95%)
soll der eigentliche z-Wert der Standardnormalverteilung bei einem Konfidenzniveau alpha = 5% sein , also die Sicherheit der Aussage beschreibend
und d=0,05 (Stichprobenfehler von 5%)
soll der wählbare Unsicherheitsbereich (Konfidenzintervall) sein, manchmal auch als "einseitige Fehlerabweichung vom Stichprobenmittelwert" bezeichnet, also die Genauigkeit der Aussage beschreibend.

Ich hätte jetzt folgendes verstanden:

Ich soll nach dieser Formel 367 von 8000 Stk. als Stichprobe untersuchen.
Habe ich das gemacht, kommt als Betroffenheit von mir aus 10% (37 Stk.) heraus.
Nun kann ich mit 95%iger (k=1,96) Sicherheit sagen, dass insgesamt (also von der Grundgesamtheit) ebenfalls 10% betroffen sind, also 800 Stk.
Mit einer Unsicherheit von +- 5% (d=0,05) also 40 Stk.

Ist dem so?

Was wäre deiner Meinung nach die richtige Bezeichnung für d?

Meinst du, ich sollte mir das Buch mal in der Bibo anschauen?

Vielen dank für deine Hilfe!
MfGMN

20.05.2007, 06:34

Auf diesen Beitrag antworten »

....erbitte eine (letzte) Antwort, Arthur.
Dankeschön!
MfGMN

Neue Frage »

Antworten »

Stichprobenumfang

Verwandte Themen