Stichprobengröße Hypothesentest [war: Statistikproblem]

Neue Frage »

juergen_D Auf diesen Beitrag antworten »
Stichprobengröße Hypothesentest [war: Statistikproblem]
Hi
hab folgendes Problem: Soll bei 100 Lieferanten, die je 10 Versicherungspolicen haben müssen eine Stichprobenprüfung durchführen um sicher zu sein, daß mit einer Wahrscheinlichkeit von x% alle die entsprechenden Versicherungen abgeschlossen haben.

Wie gehe ich da ran?

Im 2.Schritt soll dann - je nach Ergebnis der 1.Runde - der Stichprobenumfang vergrößert oder verkleinert werden.

Wie gehe ich da ran?


Zellerli: Titel angepasst.
Zellerli Auf diesen Beitrag antworten »

Es würde schonmal helfen, wenn du das Problem auf das nötigste reduzierst:

Wenn ein Lieferant nur 9 Policen hat, ist das genauso "durchgefallen" wie wenn er garkeine hat, oder?
Also ist es schonmal egal wieviele das sind: entweder er hat alle, oder nicht alle.

Damit sind wir bei einer Binomialverteilung, bzw. eigentlich bei einer Hypergeometrischen Verteilung (weil bei 100 Probanden der Eingriff durch das herausnehmen eines einzelnen in die zu Grunde liegende Verteilung nicht verschwindend gering ist).

Dann ist ein wichtiges Wort "alle". Also darf in deiner Stichprobe keiner Patzen, weil wenn einer patzt hast du ja bereits mindestens 1%, der seine Versicherungen nicht abgeschlossen hat.

Du suchst also nach einer Stichprobengröße, bei der alle gezogenen "Treffer" (im Sinne von: Hat die Policen) sein müssen und man dann mit einer Wahrscheinlichkeit von x sagen kann, dass alle die Police haben.

Also Hypergeometrisch wird das hässlich. Ich würde mal Binomialverteilt ansetzen.


Übrigens haben wir eine Abteilung für Statistik Augenzwinkern Und treffende Titel sind stets hilfreich.
juergen_D Auf diesen Beitrag antworten »
RE: Stichprobengröße Hypothesentest [war: Statistikproblem]
Hi

ich bin mir ziemlich (90% oder mehr) sicher, daß alle die notwendigen Policen haben. Besser scheint es mir, die Stichprobengröße belastbar zu ermitteln um dann aus den Resultaten der Stichproben die Hypothese zu bestätigen oder zu widerlegen und im 2.Schritt (je nach Ergebnis der Stichprobenerhebung) die vorgenannten "90%" zu variieren?
Zellerli Auf diesen Beitrag antworten »

Das ist halt ein etwas komischer Hypothesentest, weil es keinen Fehler 1. Art gibt.

Also du wirst niemals zu Unrecht sagen: es haben nicht alle ihre Policen.

Denn du würdest das nur sagen, wenn in deiner Stichprobe einer eine Police fehlt und dann ist automatisch die Hypothese "alle haben ihre Policen" falsch.

Es kann nur den Fehler 2. Art geben, der bedeutet, dass du nach Stichprobenerhebung unterstellst, alle hätten ihre Policen, wobei es garnicht so ist.

Also ich meine man kann das hier nicht mit einer Stichprobe machen. Wenn du dir sehr sicher bist, dass alle ihre Policen haben und du hast Unrecht, dann wird der Anteil derer, die keine haben wohl sehr klein sein. Vielleicht sogar nur einer.

Und dann kannst du ja leicht ausrechnen, wie groß die Wahrscheinlichkeit ist, dass du diesen einen in der Stichprobe hast...
Huggy Auf diesen Beitrag antworten »

@ Zellerli
Entschuldige, wenn ich mich da einmische, aber ich denke, du bist da im Irrtum.

Ein Hypothesentest kann ja nie die sogenannte Nullhypothese (H0) bestätigen. Er kann sie nur auf Basis des gewählten Sigifikanzniveaus widerlegen. Wenn H0 widerlegt wird, ist das eine Bestätigung der Alternativhypothese H1 auf dem gewählten Signifikanzniveau.Wenn man also die positive Bestätigung einer Hypothese sucht, muss diese als die Alternativhypothese H1 zu einer Nullhypothese H0 formuliert werden. Für die aktuelle Aufgabe bedeutet das:

H0: Mindestens einer hat keine 10 Policen
H1: Alle haben 10 Policen

Wenn nun für einen bestimmten Stichprobenumfang alle in der Stichprobe 10 Policen haben, dann ist H0 auf dem zu dem Stichprobenumfang gehörigen Signifikanzniveau widerlegt und entsprechend ist H1 auf diesem Signifikanzniveau bestätigt. So lässt sich der notwendige Stichprobenumfang bestimmen.
Zellerli Auf diesen Beitrag antworten »

Ah. Gute Idee.

Wobei... Es kann hier immernoch nicht den Fehler geben, dass man fälschlicher Weise H0 annimmt.
Und der Fehler, dass man fälschlicher Weise H1 annimmt (gerade bei nur einem schwarzen Schaf) ist enorm.

Mein Problem ist eben auch die Art der Aufgabe: Man kontrolliert nicht den Ausschussanteil von Fabrikmaschinen auf eine gewisse Toleranz genau, sondern will wissen ob alle (und nur alle) Menschen ihre Policen abgeschlossen haben.

Dann hat man ja ein Signifikanzniveau (über die Definition: Wahrscheinlichkeit des Fehlers 1. Art) von 100%. Würde man die Hypothesen tauschen hätte man ein grausames Signifikanzniveau, solange man nicht die Stichprobenzahl in die Größenordnung der Grundgesamtheit bringt.

Also ich habe doch noch Zweifel...
 
 
Huggy Auf diesen Beitrag antworten »

@ Zellerli

Ja, die Sache ist ein wenig diffizil!

Also, man hat 100 Lieferanten und man möchte wissen, ob alle 10 Policen abgeschlossen haben. Man möchte aber nicht alle Lieferanten überprüfen, was ein definitives Ergebnis erlaubt. Man möchte nur n (n < 100) Lieferanten überprüfen, und sich mit einem statistischen Ergebnis begnügen.

Wenn nun mindestens einer der n überprüften Lieferanten keine 10 Policen hat, dann hat mein ein definitives Ergebnis und ein nachfolgender Hypothesentest ist sinnlos.

Bedarf für einen Hypothesentest gibt es nur, wenn die n überprüften Lieferanten alle 10 Policen haben. Und dann gibt es auch einen Fehler 1. Art und einen Fehler 2. Art.
Zellerli Auf diesen Beitrag antworten »

Wann soll der Fehler auftreten "ich behaupte fälschlicher Weise, dass mindestens einer seine Policen nicht hat"?

Dazu müsste man eine gesunde Stichprobe haben und trotzdem darauf schließen, dass einer seine Policen nicht hat. Aber dann hätte man garkein Stichprobenergebnis, was dazu führen würde, dass man jemals annimmt: Jeder hat seine Policen.
Wenn man nämlich einen Patzer in der Stichprobe hat, wird man zu Recht und ohne einen Fehler zu machen sagen: Es haben nicht alle ihre Policen.

Also nochmal übersichtlich:
Alle Stichprobanden haben ihren Policen --> Man nimmt an dass jeder der 100 sie hat. Dabei kann man sich irren.
Nicht alle Stichprobanden habe ihre Policen --> Man nimmt an, dass nicht jeder der 100 sie hat. Dabei kann man nicht irren, weil man ja bereits einen von 100 gefunden hat, der sie nicht hat.
Huggy Auf diesen Beitrag antworten »

@ Zellerli

Okay, ich will mal versuchen, meinen Gesichtspunkt beispielhaft klar zu machen. Es gibt 100 Lieferanten. Ich möchte wissen, mit welcher Wahrscheinlichkeit alle 100 Lieferanten 10 Policen haben. Ich befrage n ( n < 100) Lieferanten. Jetzt sind zwei Fälle zu unterscheiden:

a) Mindestens einer der n befragten Lieferanten hat keine 10 Policen. Dann ist die Wahrscheinlichkeit, dass alle 100 Lieferanten 10 Policen haben 0 und ein Hypothesentest erübrigt sich.

b) Alle n befragten Lieferanten haben 10 Policen. Jetzt kann man einen Hypothesentest machen.

Es sei p die Wahrscheinlichkeit, dass ein beliebiger Lieferant 10 Policen hat. Dann ist die Wahrscheinlichkeit, dass alle n befragten Lieferanten 10 Policen haben gleich p^n. Die Wahrscheinlichkeit, dass mindestens einer keine 10 Policen hat, ist also 1 - p^n.

Wenn man nun mit der Hypothese H0

H0: mindestens einer hat keine 10 Policen

arbeitet, ist der Fehler erster Art ( H0 richtig, aber abgelehnt) = p^n.

Ich hoffe, ich habe meinen Gesichtspunkt deutlich machen können. Nach den Angaben des Thread-Erstellers wäre mit p = 0,9 zu arbeiten.
Zellerli Auf diesen Beitrag antworten »

Ich glaube nicht, dass wir mit p=0,9 für "ein kontrollierter Lieferant hat alle Policen" arbeiten können (so habe ich das nicht herausgelesen). Falls doch, hat sich das alles schon ziemlich erübrigt.

Ich dachte, dass wir mit einem Signifikanzniveau von 90% arbeiten sollen.

Oder man nimmt die Aussage von juergen_D
Zitat:
ich bin mir ziemlich (90% oder mehr) sicher, daß alle die notwendigen Policen haben.
so, dass
.
Wenn wir schon einen Wert haben, dann wohl diesen.
Per definitionem kommen wir mit diesem Wert aber erst bei n=100 auf die 90% Signifikanzniveau.
Mit p=0,9 können wir echt nicht arbeiten. Würde man p=0,9 annehmen, kann man sich den Test auch sparen, weil da jeder Konrtolleur seine Hand dafür ins Feuer legen würde, dass nicht alle ihre Policen haben (Wahrscheinlichkeit 0,9997).

Ich verstehe also nach wie vor nicht, auf welcher Grundlage man einen Hypothesentest machen könnte.
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von Zellerli
Ich glaube nicht, dass wir mit p=0,9 für "ein kontrollierter Lieferant hat alle Policen" arbeiten können (so habe ich das nicht herausgelesen). Falls doch, hat sich das alles schon ziemlich erübrigt.

Ich dachte, dass wir mit einem Signifikanzniveau von 90% arbeiten sollen.

Ich habe inzwischen auch Zweifel an meiner Interpretation. Ich hatte die 0,9 des Thread-Erstellers in doppeltem Sinn interpretiert. Einmal als Beispiel für die gewünschte Sicherheit des Hypothesentests. Und zum anderen

Zitat:
ich bin mir ziemlich (90% oder mehr) sicher, daß alle die notwendigen Policen haben.

als Wahrscheinlichkeit dafür, dass ein beliebig herausgegriffener Lieferant alle 10 Policen hat. Aber bei nochmaligem Lesen gibt der Text diese Interpretation nicht her. Und wenn doch, würde es nicht helfen. Denn wenn man bei p = 0,9 99 Lieferanten überprüft und alle haben 10 Policen, ist die Wahrscheinlichkeit, dass der 100. nicht alle 10 Policen hat, noch immer 0,1. Um eine Information über p nutzen zu können, müsste p größer sein als die gewünschte Sicherheit des Hypothesentests. Mit z. B. p = 0,995 würde es genügen, 79 Lieferanten zu überprüfen. Die Wahrscheinlichkeit, dass die 21 nicht überprüften Lieferanten auch alle 10 Policen haben, ist dann = 0,995^21 > 0,9.

Wenn p unbekannt ist, sehe ich auch nicht, wie man im Rahmen der 'orthodoxen' Statistik einen Hypothesentest machen sollte. Bayesianer könnten es allerdings, weil es ihnen erlaubt wäre, aus n überprüften Lieferanten eine Verteilungsfunktion für p zu generieren. Allerdings hat die bayesiansiche Interpretation von Wahrscheinlichkeit keine allgemeine Anerkennung.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »