Stichprobengröße

Neue Frage »

Sonja Auf diesen Beitrag antworten »
Stichprobengröße
Hallo!

Ich bin schon ziemlich verzweifelt. In meiner Arbeit ist eine interessante Frage aufgetauch. Ich bin ein Mathefreund und habe mich auf die Suche gemacht, kann aber nichts Brauchbares finden.
Es ist eine allgemeine Frage zur Stichprobengröße. Gibt es eine Formel, wie ich die Stichprobengröße berechnen kann? Ich weiss nur die Formel zur Konfidenzintervallberechnung. Das ist aber nicht anwendbar.

Es ist so: Beim Wareneingang wird jede Lieferung bemustert. Die Lieferung kann immer unterschiedlich sein, es können verschiedene Gebinde mit verschiedenem Material kommen, die wir bemustern müssen. Ich sollte ein allgemein gültigen Vorschrift für unsere Firma vorschlagen, wie viele Gebinde wir bemustern. In der Firma verwenden wir \sqrt{x} + 1, wobei x Anzahl der Gebinden in der Lieferung ist. Ich habe keine Ahnung woher das kommt und ob es richtig ist. Ist es überhaupt möglich? - Ich meine, ich bekomme homogenes Material in verschiedenen Gebinden, dann muss ich aber auch die Menge von einer Probe bestimmen nicht nur wie viele Gebinden ich beprobe, oder?

Meine Überlegungen sind auch: Ich habe keine Regeln gefunden, nach der die Stichprobenröße nur anhand von Grundgesamtheit berechnet wird. Wir könnten die Anzahl von den zu bemusterten Gebinden relativ festlegen, z.B. 5%. Wäre das statistisch richtig?

Ich weiss nicht weiter, wahrscheinlich kann mir jemand ein Tipp geben, wie ich weiter vorgehen soll.


Danke im Voraus!

LG Sonja
AD Auf diesen Beitrag antworten »
RE: Stichprobengröße
Zunächst zum Begriff: Was ist "Bemustern" ? Ist das sowas wie eine Qualitätskontrolle? Oder ist das anhand der Stichprobe eine quantitative Klassifizierung für die ganze Warenlieferung (soundsoviel Prozent diese Klasse, soundsoviel Prozent jene Klasse)?
Sonja Auf diesen Beitrag antworten »
RE: Stichprobengröße
Hi,

du hast recht. Bemustern ist eine Art von Qualitätskontrolle. Es werden Proben entnommen und dann werden sie analysiert, ob alles so ist, wie es sein soll. Es ist sehr wichtig, da kann man sich keine Fehler leisten. Frage ist wie viele Gebinde, resp. wie viele Proben müssen wir entnehmen, dass es statistisch signifikante Stichprobe wird?
Gestern habe ich noch weiter nachgedacht und mit Kollegen diskutiert. Es gibt auch eine andere Sichtweise. Gehen wir davon aus, dass die Lieferung ein homogenes Material ist und es ist eine Charge von dem Produkt (zwei Chargen müssen so wie so getrennt behandelt werden). Das heißt es wurde in einem Prozess/Schub produziert und Material sollte homogen sein. Könnte theoretisch eine Probe von einem Gebinde ausreichen?

LG Sonja
pulcino Auf diesen Beitrag antworten »

Hallo,

habe ein ähnliches Problem. Ich versuche herauszufinden, bei wievielen unserer Lieferungen wir die Temperatur überwachen sollten, um eine repräsentative Stichprobe zu erhalten. Alle Lieferungen zu monitoren wäre viel zu teuer. Habe bisher im Internet folgendes zu dem Thema gefunden:


http://statistik.wu-wien.ac.at/lv/PI_sta..._KI-handout.pdf

http://tud.at/statistik/matstat1.htm

Einfach nach dem Wort "Stichprobengröße" suchen und du gelangst an die richtige Stelle im Dokument.

Gruß

pulcino
kurellajunior Auf diesen Beitrag antworten »

Um die Statistik auf so reale Probleme anzuwenden fehlen ein paar Daten, aber zum Prinzip:

Du must die Kosten für ein Monitoring mit der Anzahl der Monitorings multiplizieren dazu die Kosten für ein Nichtentdeckten Fehler mit der Wahrscheinlichkeit das ein solcher Fehler auftritt (Abhängig von der ANzahl der Monitorings und der realen Fehlerwahrscheinlichkeit) und mit den Kosten üfr einen fälschlicherweise entdeckten Fehler mal dieser Wahrscheinlichkeit addieren. Das Minimum dieser Funktion gibt die "sinnvolle" Anzahl der Monitorings an...

Wenn Du das wirklich hier durchrechnen willst, sag bescheid, dann müssen iwr erst noch alle Daten sammeln...

Jan
pulcino Auf diesen Beitrag antworten »

Hallo Jan,

zunächst einmal "Vielen Dank" für deine Hilfe. Der Lösungsansatz gefällt mir: Berechnung der optimalen Stichprobengrösse durch Minimierung der Gesamtkosten. Dadurch ist es möglich den Kompromiss zwischen Kosten und Qualitätssicherung zu schaffen.

Wenn ich das richtig verstanden habe, lautet die Kostenfunktion so:

F(x)= CM*x + CF*WF(x,w)*(y-x) + CFF*WFF(x,w)*x mit

CM = Kosten pro Monitoring
x = Anzahl der Monitorings
y = Anzahl der Lieferungen (bekannt)
CF = Kosten für einen nichtentdeckten Fehler
WF=Wkt., dass ein Fehler auftritt, den ich nicht entdecke (weil ich ihn nicht messe)
w = Wkt., dass ein Fehler auftritt
CFF = Kosten für einen fälschlicherweise entdeckten Fehler
WFF= Wkt., dass ich einen Fehler entdecke, der keiner ist

CM*x steht für die Kosten, die mir durch das Monitoring entstehen. Wohingegen CF*WF(x,w)* (y-x) die Kosten beziffert, die dadurch entstehen können, dass ich eine gewisse Anzahl an Lieferungen (y-x) nicht monitore.

Die Wkt., dass ich fälschlicherweise einen Fehler entdecke (WFF) ist meines Erachtens "Null", wenn ich annehme, dass mein Monitoringsystem richtig misst. Dadurch fällt der hintere Teil der Kosten-Funktion weg.

Nun gilt es noch CM und CF abzuschätzen. Ich denke das kriege ich hin.

Aber wie bekomme ich WF(x,w)?
Die reale Wkt. w, dass ein Fehler auftritt, d.h. eine Temperaturabweichung auf einer der Lieferungen auftritt, kenne ich natürlich nicht. Ich könnte Sie lediglich aus der Anzahl der Fehler abschätzen, die in 2004 durch die gemachten Monitorings identifiziert wurden. Kann ich das machen?

Y ist die Anzahl aller Lieferungen:

Mir ist klar, dass WF=0, wenn X=Y, d.h. wenn ich alle Lieferungen monitore, dann ist die Wkt., dass ein Fehler auftritt, den ich nicht entdecke gleich "Null".

Andersherum ist WF=w, wenn X=0, d.h. wenn ich keine Lieferungen monitore, dann ist die Wkt., dass ein Fehler auftritt, den ich nicht entdecke genauso groß, wie die Wkt., dass überhaupt ein Fehler auftritt.

Damit würde unter der Annahme, dass es sich bei WF(x) um eine lineare Funktion handelt, folgendes ergeben:

WF(x) = -(w/y)*x + w, mit y>0

und damit:

F(x)=CM*x + CF*(-(w/y)*x +w)*(y-x) + CFF*WFF(x,w)*x, wobei gilt: WFF(x,w)=0

Wenn ich die 1. Ableitung dieser Exponential-Funktion gleich "Null" setze und nach x auflöse ergibt sich als optimale Stichprobengrösse:

(1-CM/2*CF*w)*y

Was sich meiner Meinung nach sehr gut anhört. Was meinst du? Kann ich das so machen?

Hast du eventuell noch einen Tip, wie hierzu das Theoretische Modell lautet und in welcher Literatur ich diesen theoretischen Ansatz finde, so dass ich darauf verweisen kann. Vielen Dank.

Gruß

pulcino
 
 
kurellajunior Auf diesen Beitrag antworten »

Ich hab' Deine Fragestellung nochmal gelesen...
Mein Ansatz geht davon aus, dass nicht nur eine vernünftige Stichprobe entsteht, sondern dass aus einer Fehlentscheidung Kosten resultieren.
Wenn dem nicht so ist, müssen wir die Sache anders angehen, ansonsten:

Ich gehe davon aus, dass es eine Menge von Lieferungen gibt. Wenn eine Lieferung untersucht wird, wird sie rausgeschmissen, falls sie fehlerhaft ist.

Leichter wäre, es gibt Lieferungen. Aus einer Lieferung der Mächtigkeit m werden n Stichproben genommen, Wenn min i von n Stichproben fehlerhaft sind, wird die Lieferung abgewiesen. Aber das ist es wohl nicht.

Beim Lesen ist mir eingefallen, dass noch ein Summand fehlt: Kosten für einen entdeckten Fehler.

Deine Variablenbezeichnung ist für arme Statistiker sehr schwer lesbar, ich mach mal für mich verständlicher:

Anzahl der Monitorings
Anzahl der Lieferungen

Kosten pro Monitoring
Kosten für eine fehlerhafte in Produktion übernommene Lieferung
Kosten für die Entfernung der Lieferung (Unterbrechung etc.)

absolute Wahrscheinlichkeit eines Fehlers pro Lieferung
Wahrscheinlichkeit einen Fehler beim Monitoring zu entdecken
Wahrscheinlichkeit einen Fehler beim Monitoring zu entdecken, der keiner ist.


wegen und fällt der Rest weg. Ob das so geht? Augenzwinkern

Zitat:

Aber wie bekomme ich WF(x,w)?
Die reale Wkt. w, dass ein Fehler auftritt, d.h. eine Temperaturabweichung auf einer der Lieferungen auftritt, kenne ich natürlich nicht. Ich könnte Sie lediglich aus der Anzahl der Fehler abschätzen, die in 2004 durch die gemachten Monitorings identifiziert wurden. Kann ich das machen?
Anders gehts nicht Augenzwinkern
Also muss geschätzt werden.

Zitat:
Damit würde unter der Annahme, dass es sich bei WF(x) um eine lineare Funktion handelt, folgendes ergeben:
Autsch Hammer
Siehe meine geänderte Funktion für die Kosten...

Literatur hab' ich keine Idee, da ich Informatiker und nicht BWLer bin.

Die Funktion oben lässt sich einfach auf ein Minimum untersuchen:

Aber da kommt keine Anzahl der Monitorings raus...

also suchst Du vielleicht doch eine passable Größe für die Stichprobe, da wäre aber relevant, welche Effekte entstehen, wenn die Stichprobe zu klein ist?

Jan
pulcino Auf diesen Beitrag antworten »

um auf deine letzte Frage zu antworten: So ist es.

Ich habe eine bestimmte Anzahl an Lieferungen, die wir zu unseren Kunden schicken. Bei allen Lieferungen zu unseren Kunden (Anzahl gegeben z.B. M) ein Temperaturmessgerät beizupacken, um zu kontrollieren, ob die Temperaturbedingungen eingehalten werden, wäre zu teuer und ist auch nicht erforderlich. Daher bin ich auf der Suche nach der repräsentativen Stichprobengröße x. Also:

Wieviel Lieferungen x von M muß ich monitoren, um z.B. 95% der auftretenden Temperaturabweichungen zu identifizieren. Das muss doch rein statistisch berechenbar sein, aber wie? Im Grunde habe ich eine Menge von Kugeln (schwarze und weisse), und ich will wissen, wieviele Kugeln ich in einer zufälligen Stichprobenauswahl (ohne Zurücklegen) ziehen muss, um z.B. 95% der schwarzen Kugeln dabeizuhaben (homograder Fall).

schwarz=Lieferung, bei der eine Temperaturabweichung auftritt
weiss= Lieferung, bei der keine Temperaturabweichung auftritt

Ich weiss nichts über die Verteilung der schwarzen Kugeln kann aber den Anteil der schwarzen Kugeln (Temp.Abweichungen) in der Grundgesamtheit (alle Lieferungen) durch meine Messungen in 2004 abschätzen. Was ist ein guter Schätzer für den Anteil meiner schwarzen Kugeln in der GG?

Ausserdem kann man doch sicher von einer Normalverteilung der schwarzen Kugeln ausgehen, oder?

Wie berechne ich die notwendige Stichprobengrösse um z.B 95% aller schwarzen Kugeln in meiner Ziehung zu haben?

Auf ein Neues...
kurellajunior Auf diesen Beitrag antworten »
Bitte jemand übernehmen
Zitat:
Original von pulcino
Ich weiss nichts über die Verteilung der schwarzen Kugeln kann aber den Anteil der schwarzen Kugeln (Temp.Abweichungen) in der Grundgesamtheit (alle Lieferungen) durch meine Messungen in 2004 abschätzen. Was ist ein guter Schätzer für den Anteil meiner schwarzen Kugeln in der GG?

Ausserdem kann man doch sicher von einer Normalverteilung der schwarzen Kugeln ausgehen, oder?

Danke, das nächste mal gleich die ganze und richtige Aufgabenstellung.

1. ja, Du kannst von Normalverteilung ausgehen.
2. @andere HILFE! sowas hab ich nicht im Kopf. Das mit der Verteilung und den 95% ist zwar standard, mach ich aber selten. (Und mein Übersichtsblatt noch nicht gefunden Augenzwinkern )

Jan
AD Auf diesen Beitrag antworten »

Zitat:
Original von pulcino
Wieviel Lieferungen x von M muß ich monitoren, um z.B. 95% der auftretenden Temperaturabweichungen zu identifizieren.

Wenn du die Frage so stellst, lautet die bittere Antwort: Im worst-case x=M.

Treten z.B. nur bei einer Lieferung Temperaturabweichungen auf, und die ist zufällig gerade die letzte in der Reihe zu überprüfender Lieferungen, dann kommt man auf dieses Resultat.

Wenn du natürlich nur im Mittel die 95% der Temperaturabweichungen rausfischen willst, dann musst du auch genau 95% der Lieferungen kontrollieren - und zwar gleichgültig, wie hoch der eigentliche Anteil der Temperaturabweichungen in der Gesamtlieferung ist!

Eine völlig andere Fragestellung wäre diese: Welchen Anteil der Lieferung muss ich kontrollieren, um einigermaßen (also so 95 - 99%) verlässliche Angaben über den Anteil der fehlerhaften Lieferungen zu erhalten, das läuft auf Konfidenzintervall dieses Fehleranteils hinaus. Das hilft aber nicht bei der Einzelidentifizierung der Fehlerlieferungen!

Um es nochmal deutlich zu machen: Mit üblichen statistischen Mitteln, also (im Vergleich zur Gesamtmenge) kleinen Stichproben kann man keine Aussagen "OK/fehlerhaft" zu konkreten einzelnen Stücken machen, sondern nur Wahrscheinlichkeiten für diese Aussagen schätzen - ist eigentlich logisch, musste aber nochmal gesagt werden.
confused-one Auf diesen Beitrag antworten »

Zitat:
Original von pulcino


Wenn ich die 1. Ableitung dieser Exponential-Funktion gleich "Null" setze und nach x auflöse ergibt sich als optimale Stichprobengrösse:

(1-CM/2*CF*w)*y

pulcino


und die formel funktioniert genau so? nur so von wegen "punkt-vor-strich" operationen sprich multiplikation und division vor addition und subtrahktion...

wenn ich folgende werte habe komme ich auf eine unmögliche zahl:

CM = 4
CF = 708 (ich muss bei einem fehler die gesamte lieferung kontrollieren also y * CM)
w = 0.91
y = 177

wo könnte da der fehler liegen?
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »