NSU berechnen

Neue Frage »

mickey Auf diesen Beitrag antworten »
NSU berechnen
hallo an alle,


ich stehe grade vor folgendem problem:

kann man den NSU (notwendigen stichprobenumfang) berechnen, ohne angaben über die verteilung der gesamtmenge zu haben und ohne normal-, binomialverteilung oder eine andere verteilung voraus zu setzen???
wenn ja, wie könnte das funktionieren?
wenn nein, warum ist der bezug zu einer konkreten verteilung unerlässlich?




vielen dank schon mal im voraus
mickey
AD Auf diesen Beitrag antworten »

Das ist, nur leicht variiert, dieselbe Frage wie hier:

NSU berechnen

Für mich stellt sich die Frage: Notwendig wofür? Mit Vorgabe irgendeiner Bestimmtheit (also sowas wie Konfidenzintervallbreite irgendeines Parameters o.ä.) ? Über sowas solltest du dir schon Gedanken machen, wenn du so eine Frage hier stellst.
mickey Auf diesen Beitrag antworten »

hab die frage zu erst ausversehen bei schulmathematik reingeschrieben... sorry

das problem hat folgenden hintergrund:
von eine menge von daten (z.B. kundendaten von einer versicherung) soll eine stichprobe genommen werden. anschließend soll die verteilung verschiedener schlüssel aus der stichprobe ermittelt werden.
es gilt nun eine aussage über die notwendige stichprobe zu treffen, ohne eine verteilung zu grunde zu legen.
mir ist klar, dass wenn ich normalverteilung oder binomialverteilung voraussetze ich mit den konfidenzintervall zu einem bestimmten niveau arbeit kann. das problem für mich ist jedoch, dass ich keine annahmen über die verteilung im voraus treffen darf.

mag sein, dass ich den walt vor läuter bäumen nicht sehe...

daher bin ich halt sehr dankbar, falls jemand einen tipp hat.


und sorry nochmal, dass ich den beitrag zu ausversehen zu erst in der falschen kategorie eingetragen habe... der wird ketzt gleich gelöscht

danke
mickey
AD Auf diesen Beitrag antworten »

Also geht es in Grunde genommen um etwas ähnliches wie hier:

Grundgesamtheit vs. verkleinertes Abbild - Mindestumfang Zufalls-Stichprobe

Ich hoffe nur stark, dass der Findungsprozess dessen (also was du nun genau willst), nicht so lang dauern möge, wie im verlinkten Thread. Augenzwinkern
mickey Auf diesen Beitrag antworten »

ok,

wenn ich das alles so richtig verstanden habe, geht es bei dem link darum zu ermitteln, ob eine erhobene stichprobe ein signifikantes ergebnis liefert.
für diese berechnung gibt es einstichprobentests: gauß-, t-test, approximativer binomialtest...
ich will aber nicht meine stichprobe testen, sondern ersteinmal berechnen UND das möglichst gut.
konfidenzitervalle mit (un-)bekannter kann ich berechnen,wenn diese normalverteilt sind. (1-alpha)-konfidenzintervalle für einen anteil p, kann ich berechnen,wenn diese binomialverteilt sind...

bloß wie geht das ohne aussagen über die verteilung??


lg mickey
AD Auf diesen Beitrag antworten »

Nein, es geht in dem verlinkten Beitrag auch darum, wie die Stichprobengröße bei vorgegebener Genauigkeit des Ergebnisses auf einem gewissen Konfidenzniveau zu berechnen ist. Steht nur weiter hinten. Augenzwinkern

Verteilungen? Es geht um diskrete Merkmale mit den unbekannten Wahrscheinlichkeiten - ich denke, über die willst du Aussagen treffen? Wenn nicht das, was willst du dann?
 
 
mickey Auf diesen Beitrag antworten »

mmhh,... hab mir das gestern und heute nochmal bis unten hin angeschaut...
bei dem bearbeiteten thema geht es doch aber darum, dass du die gesamtmenge N, so wie die gezogene stichprobengröße n kennst und auch k, die Menge der objekte mit einer bestimmten eigenschaft...

bei mir:
ich kenne nicht den genauen wert von N -ich weiß nur N ist ziemlich riesig
--> normalerweise könnte man für ein genügend großes N normalverteilung annehmen
DARF ich aber NICHT!!!
ich habe noch keine stichprobe genommen, kann also auch nicht klein n verwenden...

das ist auch das eigentliche problem: ich habe kaum angaben bevor ich die stichprobe ziehen will...

das einzige was mir bisher eingefallen ist, die notwendige stichprobengröße anzunehmen, diese zu testen und das ganze so häufig anzunähern, bis man die gewünschte genauigkeit erhält... was hälst du davon??
würde die schnittstelle die ich baue dann automatisch machen, aber ich möchte natürlich etwas einbauen, womit ich möglichst wenig versuche benötige...
AD Auf diesen Beitrag antworten »

Das ganze hat keinen Sinn, wenn du nicht ENDLICH mit der Sprache rausrückst, um welche Größen es dir geht! Wenn du von Normalverrteilung sprichst, hast du also irgendeine stetige Größe im Sinn - ich war davon ausgegangen, dass es um irgendwelche Kategorien (z.B. wie bei Wählerbefragung) geht. Ich erinnere mich noch mit Schrecken an den verlinkten Thread und werde mir sowas nicht wieder antun, diese endlos langen Problemfindungssitzungen. Sammle dich, und äußere klar und deutlich dein Problem: Welche Größen sollen mit dieser Stichprobe wie genau und mit welcher Sicherheit bestimmt bzw. geschätzt werden?

Bis dahin verabschiede ich mich. Wink
mickey Auf diesen Beitrag antworten »

Also lieber Herr Dent Wink

ich versuche es nochmal...
Ich habe eine Menge an Datensätzen. Um die Übersicht zu bewahren: A, B, C.
Also Also in der Gesamtmenge der Datensätze sind x-viele As, Bs, Cs (gleichviele-ist aber an sich egal). Jedes A,B,C hat einen Wert (Dezimalzahl).
Ich weiß nicht wie die Gesamtmenge der Daten verteilt ist!!!

Ziel ist es die Verteilung der As und dei Verteilung der Bs und die Verteilung der Cs aus meiner Stichprobe, die ich nehme zu ermitteln.

Frage: wie groß muss meine Stichprobe sein, um ein aussagekräftiges Ergebnis zu bekommen --> sagen wir mal 95% ???

Problem: ich könnte den NSU berechnen, wenn ich annehme: Gesamtmenge ist normalverteilt oder binomialverteilt... das soll ich aber nicht (Die Gesamtmenge ist zwar riesig, aber ich darf trotzdem keine Normalverteilung voraussetzen traurig )

bisschen deutlicher geworden... falls nein unglücklich , dann kurz nein unglücklich schreiben Augenzwinkern
AD Auf diesen Beitrag antworten »

Wenn man gar nichts weiß, d.h. gar nichts über den Verteilungstyp voraussetzen kann und will, dann bleibt einem nur die Schätzung der Verteilungsfunktion durch die empirische Verteilungsfunktion



Da eine Binomialverteilung vorliegt, kann man für große mittels Normalverteilungsapproximation das Konfidenzintervall



für aufgestellt werden. An der Medianstelle , also für , hat man die maximale Intervallbreite

.

Wenn du dir jetzt noch eine Genauigkeit für die Verteilungsfunktionswerte vorgibst, und eine Irrtumswahrscheinlichkeit (z.B. wie in deinem letzten Beitrag), dann kannst du daraus deinen NSU berechnen.
mickey Auf diesen Beitrag antworten »

ich sehe diesmal verstehen wir uns Freude

vielen vielen Dank! damit komme ich jetzt erstmal weiter smile
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »