Formel gesucht (Statistik Stichprobenumfang)

Neue Frage »

Statistiknoob Auf diesen Beitrag antworten »
Formel gesucht (Statistik Stichprobenumfang)
Meine Frage:
Hallo, ich suche die Formel, die auf dieser Seite benutzt wird
www.bauinfoconsult.de/Stichproben_Rechner.html
Dort habe ich die Werte 5%,90%,249155,50% eingegeben und das Ergebnis ist 271.
Jedoch brauche ich die Formel und nicht nur das Ergebnis, leider weiß ich nicht um welche Formel es sich dabei handelt.

Meine Ideen:
Es muss eine Formel zur Ermittlung der Stichprobengröße sein, jedoch weiß ich nicht welche dort hineinpasst.
HAL 9000 Auf diesen Beitrag antworten »

Da kramen wir mal ganz tief in der Matheboard-Kiste ... anscheinend geht es darum:

Berechnung Grundgesamtheit einer Stichprobe

Der Rechner auf der Website scheint allerdings mit der exakten hypergeometrischen Verteilung zu rechnen, vermutlichen in einem adaptiven Prozess - vielleicht ähnlich wie hier mit Golfmethode: Erst Abschlag (mit Normalverteilungsapproximation) und dann putten (mit der hypergeometrischen Verteilung). Augenzwinkern
Statistik Noob Auf diesen Beitrag antworten »

Hallo, danke für deine Hilfe soweit.
Jedoch verstehe ich nicht genau was du damit meinst "Der Rechner auf der Website scheint allerdings mit der exakten hypergeometrischen Verteilung zu rechnen, vermutlichen in einem adaptiven Prozess - vielleicht ähnlich wie hier mit Golfmethode: Erst Abschlag (mit Normalverteilungsapproximation) und dann putten (mit der hypergeometrischen Verteilung). Augenzwinkern"
Kannst du mir das erläutern? Habe den Verdacht es gibt hier einen langen und einen kurzen Weg das zu erklären, mir sind beide Recht, jenachdem wieviel Zeit du hast. Ich lerne gerne dazu und würde deswegen den Längeren bevorzugen, aber kein Stress, notfalls ist der Kurze auch ok.

Da ich nie "höhere" Statistik irgendwo gelernt habe, und es mir selbst beigebracht habe, habe ich in dem Bereich so einige Lücken.
Ich ging von einer Normalverteilung aus. Am besten gebe ich mal ein bisschen mehr Kontext. Für mein Praktikum im Bereich Marketing will ich eine Umfrage machen, die möglichst repräsentativ für den Kreis Viersen ist. Da ich alle Einwohner unter 20 Jahre rausgerechnet habe, komme ich auf eine Gesamtpopulation von 249155 Einwohnern.
Ich habe einen Konfidenzintervall von 5%, d.h. 1,645 in der z-Tabelle.

Wende ich das auf die Formel, auf der Seite die du verlinkt hast, an ergibt sich folgendes:
4x1,645² x [0,5x(1-0,5)/0,01]=270,6025 gar nicht so weit von 271 entfernt Big Laugh )

Ich bin mir nicht sicher, was genau die 0,1 bedeutet, habe ein bisschen mit den Werten experimentiert ob irgendwas in meine Richtung kommt. Ich vermute das hat etwas mit dem Stichprobenfehler zu tun. Eine kleine Erklärung hier wäre hilfreich. Was ich auch nicht ganz verstehe, auf der oben verlinkten Seite muss ich die Gesamtpopulation angeben, aber die fließt hier gar nicht in die Rechnung mit ein o.O
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von Statistik Noob
Jedoch verstehe ich nicht genau was du damit meinst "Der Rechner auf der Website scheint allerdings mit der exakten hypergeometrischen Verteilung zu rechnen, vermutlichen in einem adaptiven Prozess - vielleicht ähnlich wie hier mit Golfmethode: Erst Abschlag (mit Normalverteilungsapproximation) und dann putten (mit der hypergeometrischen Verteilung). Augenzwinkern"
Kannst du mir das erläutern?

Der gescheiterte Versuch, etwas Ironie reinzubringen. Offenbar sollte man sein Gegenüber etwas besser kennen, bevor man sowas versucht - mein Fehler.

Zitat:
Original von Statistik Noob
Was ich auch nicht ganz verstehe, auf der oben verlinkten Seite muss ich die Gesamtpopulation angeben, aber die fließt hier gar nicht in die Rechnung mit ein o.O

Richtig: Die Rechnung mit Normalverteilungsapproximation ist ausgerichtet auf den Fall, dass die Gesamtpopulation sehr viel größer ist als die Stichprobengröße (quasi gegen Unendlich), und schätzt dadurch die notwendige Stichprobengröße etwas zu hoch. Bei kleineren Gesamtpopulationen sinkt daher die notwendige Stichprobengröße, was mit einer exakten (ziemlich haarigen) Rechnung mit der erwähnten hypergeometrischen Verteilung dann gezeigt werden kann. Dieser Prozess des "Sinkens" setzt deutlich merkbar allerdings relativ spät ein: So ist es z.B. in der Demoskopie relativ egal, ob es sich um Bundestags- oder Landtagswahl handelt, die notwendige Befragtenanzahl die für eine bestimmte Genauigkeit notwendig ist, ist in beiden Fällen in etwa dieselbe (da gibt es andere Probleme, z.B. die Repräsentativität).


EDIT: Noch ein Tipp: Schau dir mal den HTML-Quelltext von deinem "Stichproben_Rechner.html" an - da steht ziemlich unverblümt die Berechnung im JavaScript-Code da. Big Laugh
Statistik N00b Auf diesen Beitrag antworten »

Also ist das so, wie ich es gemacht habe richtig? Oder muss ich die Formel in irgendeiner Form verändern, um es passend zur Gesamtpopulation von 249155 Einwohnern machen?
Auf jedenfall schonmal danke bis jetzt, für die Hilfe.
HAL 9000 Auf diesen Beitrag antworten »

Der wesentliche Unterschied zur Berechnung im verlinkten Thread ist der folgende:

Von den insgesamt Elementen der Grundgesamtheit wissen wir SICHER von den der Stichprobe Bescheid, d.h. für die restlichen brauchen wir "nur" noch die relative Genauigkeit statt , d.h. wir erhalten eine Art implizite Gleichung

,

die nach aufzulösen ist. Am JavaScript-Code erkennt man, dass die Berechnung anscheinend darauf fußt (<--- EDIT: Hmm, leider doch nicht ganz. verwirrt )
 
 
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »