Anteil schätzen aus Stichprobe mit Konfidenzintervall

Neue Frage »

schnudl Auf diesen Beitrag antworten »
Anteil schätzen aus Stichprobe mit Konfidenzintervall
Ich habe ein Thema, das ich immer glaubte verstanden zu haben. Nun sehe ich aber, dass ich weit davon entfernt bin...

Es geht um das Thema "Konfidenzintervall für einen Anteilswert aus einer Stichprobe".

Ich beziehe mich auf dieses Beispiel:

Es werden n = 300 Personen befragt, ob sie zur Wahl gegangen sind. k = 267 antworten mit „Ja“.

Die Schätzung für den Anteil p in der Gesamtbevölkerung ist daher

p=267/300=0.89

Wenn ich nun unterstelle, dass der wahre Wert in der Bevölkerung tatsächlich 0.89 ist, dann kann ich mir damit ein Intervall ausrechnen, in dem der Wert einer Stichprobe zu - sagen wir 95% - liegt.

Die Standardabweichung für den Schätzwert ist dann zunächst



und zusammen mit dem p habe ich eine eindeutige Normalverteilung, für die ich das 95% Intervall um das p ermitteln kann.

Das wäre in diesem Beispiel das Intervall [0.8545;0.9255].

Ich wiederhole nochmal: Unter der Annahme, dass das p der Grundgesamtheit tatsächlich 0.89 ist, erhalte ich ein Intervall, in dem sich 95 % aller Stichprobenmittelwerte des gegebenen Umfangs befinden.

Bis hierher hätte ich das zu 100% verstanden.

Nur: Ich weiß ja nicht, wo mein wahres p liegt. Mein p der Stichprobe ist ja nur ein Schätzwert. Wieso kann ich nun behaupten, dass das wahre p zu 95% in diesem Intervall liegt? Dieses Intervall habe ich ja unter der Annahme berechnet, DASS das p eben eben 0.89 ist. Irgendwie wirkt das auf mich wie ein Zirkelschluss...Zuerst berechne ich etwas unter der Annahme p=0.89 und dann weiche ich diese Annahme durch ein Intervall auf. Dieses Intervall gibt aber nur die Wahrscheinlichkeit an, in welchem bei p=0.89 und Stichprobenumfang n=300 95% aller Stichprobenmittelwerte zu finden sind. Wieso kann ich plötzlich von diesem Intervall, welches auf einem angenommenen p beruht auf das wahre p schließen, das ich ja nicht kenne?

Ich habe bisher keine Stelle gefunden, wo dieser Schritt begründet wird.

Mir explodiert der Schädel und ich hoffe, dass mir das jemand erklären kann. Gott
klauss Auf diesen Beitrag antworten »
RE: Anteil schätzen aus Stichprobe mit Konfidenzintervall
Einige Gedanken dazu:

Man soll/muß zuerst unterschiedliche Größen unterscheidbar kennzeichnen. Statt " der Grundgesamtheit" und " der Stichprobe":
: Anteilswert der Grundgesamtheit
: Anteilswert der Stichprobe
: Standardabweichung der Grundgesamtheit
Und statt "Standardabweichung für den Schätzwert":
: Schätzwert für die Standardabweichung

Die Begriffe "unterstellen" und "annehmen" in Bezug auf den Anteilswert der Grundgesamtheit scheinen mir zu kräftig. Es wird kein Hypothesentest durchgeführt. Wie eingangs festgelegt gibt man eine "Schätzung" für den unbekannten Parameter ab, dies jedoch begründet, da erwartungstreu und konsistent.

Plausibel wird das Konfidenzintervall wohl erst in der Masse. Würde man viele Stichproben nehmen, erhielte man viele verschiedene Anteilswerte in der Stichprobe und viele verschiedene Konfidenzintervalle. Man kann jedoch sagen, dass 95 % dieser Konfidenzintervalle den wahren Anteilswert der Grundgesamtheit enthalten. Daher nimmt man letztlich 1 Stichprobe und "vertraut" darauf, dass sie zu diesen 95 % gehört.

Die Aussage ist auch sorgfältig zu formulieren. "Anteilswert der Grundgesamtheit liegt mit 95%iger Wahrscheinlichkeit im Intervall" oder "fällt mit 95%iger Wahrscheinlichkeit in das Intervall" sind zumindest mißverständlich. Das suggeriert, dass man ein festes Intervall nimmt und dann ein zufälliger Anteilswert dort hineinfällt. Tatsächlich steht aber der Anteilswert der Grundgesamtheit fest (unbekannterweise) und das Intervall ist zufällig. Der wahre Anteilswert liegt also stets entweder 100 % sicher innerhalb oder außerhalb des Intervalls, man weiß es nur nicht. Daher findet man zumeist eine Aussage der Form "Wahrscheinlichkeit, dass das (zufällige) Konfidenzintervall den wahren Parameter der Grundgesamtheit überdeckt, beträgt 95 %".

Viel mehr kann ich an dieser Stelle nicht dozieren. Wäre interessant, welche erwähnenswerten Aspekte andere Helfer noch finden.
schnudl Auf diesen Beitrag antworten »
RE: Anteil schätzen aus Stichprobe mit Konfidenzintervall
Vielen Dank einmal!
Ich habe mich mit der Symbolik etwas zurückgehalten, da die Eingabe von LateX hier etwas mühsam ist. Mir ist aber schon bewusst, was du ganz oben schreibst.

Der springende Punkt ist nun der:
Ich erhalte aufgrund einer Stichprobe einen Wert . Dieser Wert liegt mit einer gewissen Wahrscheinlichkeit in einem bestimmten Intervall um den wahren Wert . Es wird nun aber der Spieß umgedreht und man geht stillschweigend davon aus, dass der wahre Wert in einem Intervall der selben Breite um die Schätzung liegt. Und das verstehe ich nicht. Ich hätte dies gerne mathematisch bewiesen, kann diesen Beweis aber nirgends finden. Es wird in allen Informationsquellen immer nur gezeigt, wie man praktisch rechnet, aber genau dieser Beweis wird nicht erbracht.
klauss Auf diesen Beitrag antworten »
RE: Anteil schätzen aus Stichprobe mit Konfidenzintervall
Ein größerer Beweis liegt mir auch nicht vor. Der mag vielleicht auch gar nicht nötig sein. Es kann auch daran liegen, dass die Fragestellung bisher unzureichend war. Deshalb habe ich nochmal drüber nachgedacht und versuche es so aufzuzäumen:

1)
Zitat:
Original von schnudl
Ich erhalte aufgrund einer Stichprobe einen Wert . Dieser Wert liegt mit einer gewissen Wahrscheinlichkeit in einem bestimmten Intervall um den wahren Wert .

Das ist der übliche Einstieg in die Stichprobenverteilung, wenn man bekannte Parameter voraussetzt. Die Wahrscheinlichkeit, dass in ein Intervall um fällt, soll 0,95 betragen.
Unter Verwendung der Normalverteilung ergeben sich die Intervallgrenzen



2)
Zitat:
Original von schnudl
Es wird nun aber der Spieß umgedreht und man geht stillschweigend davon aus, dass der wahre Wert in einem Intervall der selben Breite um die Schätzung liegt.

Ich habe mich nun gefragt, ob diese scheinbar umgedrehte Fragestellung nicht etwa im Ergebnis tautologisch ist. Daher stelle ich die Frage so:
Wenn ich ein bestimmtes getroffen habe, in welchem Intervall müßte dann liegen, damit mein mit 95%iger Wahrscheinlichkeit nicht weiter als die halbe Intervallbreite entfernt ist.
Mit gilt







Mit gilt dann aber für ein konkretes auch durch einfache Umstellung , damit die Wahrscheinlichkeit erhalten bleibt.

Wie bereits erwähnt, kommt es ja beim Konfidenzintervall nur darauf an, dass mit einer bestimmten Wahrscheinlichkeit überdeckt wurde. Es ist jedoch unerheblich, ob schön nahe der Mitte des Intervalls liegt oder gerade so am Rand, Hauptsache, es wird überdeckt.

Im übrigen sei noch bemerkt, dass bei der Schätzung der Standardabweichung gern durch geteilt wird. Dadurch wird das Konfidenzintervall dann noch etwas breiter, also die Unsicherheit größer.

Ich hoffe, das ist alles so haltbar. Korrekturen erwünscht.
schnudl Auf diesen Beitrag antworten »

Ich denke, dass Du meine Frage verstanden hast und womit ich mein Problem habe. Ich befürchtete schon, dass es nicht rübergekommen sein könnte, aber du hast es!

Momentan brummt mir der Kopf und ich muss erst mal klare Gedanken fassen. Ich vesuche zu rekapitulieren, was Du geschrieben hast und melde mich wieder... verwirrt
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »