Statistischer Test zur Verteilung von m/w im Sample

Neue Frage »

Chanel123 Auf diesen Beitrag antworten »
Statistischer Test zur Verteilung von m/w im Sample
Meine Frage:
Hey,
ich habe einen Fragebogen erstellt, welcher von n=1.095 Personen beantwortet worden ist. Nun möchte ich prüfen, ob sich das Verhältnis zwischen männlichen und weiblichen ProbandInnen meines Samples signifikant von der Grundgesamtheit unterscheidet. Die Grundgesamtheit setzt sich zu 52,44% aus Jungs zusammen (15.906) und dementsprechend zu 47,56 % aus Mädchen (14.425).

Meine Ideen:
Welcher Test eignet sich eurer Meinung nach für mein Vorhaben am besten? Der Chi-Quadrat-Homogenitätstest? Mir wäre ein Test lieber, der wie der t-Test, eben nur für kategorielle Variablen, funktioniert. Hat jemand einen Tipp für mich?

LG
Namenloser324 Auf diesen Beitrag antworten »

Ich bin dafür eigentlich nicht der richtige Ansprechpartner, aber es scheint sonst keiner drauf anzuspringen:
Wieso wäre der Chi-Quadrat-Test hier anwendbar? Eine Normalverteilung liegt nicht vor und ich sehe nicht wie der zentrale Grenzwertsatz zur Anwendbarkeit führen könnte. (Das sind ja die üblichen zwei Argumente zur Anwendbarkeit des Tests).

Ist vielleicht ein Neyman-Pearson-Test denkbar? Den kann man auch für diskrete Verteilungen formulieren und wäre in gewissem Sinne optimal.

Ansonsten hast du ja das WK-Maß der Grundgesamtheit gegeben durch P(Xi = M) = p und P(Xi = W) = 1- p.

Dann kannst du leicht via Bernoulliverteilung (welche auf die Binomialveteilung führt) ein Konfidenzintervall für die Anzahl an Erfolgen/Misserfolgen (ob das Xi = M oder Xi = W bedeutet überlasse ich dir :P ) bestimmen und schauen, ob dein Sample drinliegt oder nicht.

Siehe:
stats.stackexchange.com/questions/412515/how-to-calculate-a-confidence-interval-for-a-series-of-bernoulli-trials
Chanel123 Auf diesen Beitrag antworten »

Hey Namenloser,
danke für die Antwort Augenzwinkern Der Chi-Quadrat-Homogenitätstest prüft meines Wissens nach, ob zwei Zufallsvariablen (in meinem Fall m/w der Grundgesamtheit und m/w der Studie) dieselbe Verteilung aufweisen. Ich habe mir gedacht, wenn dieser Test keinen signifikanten Unterschied erkennt, kann ich davon ausgehen, dass sich meine m/w Verteilung nicht signifikant von der m/w Verteilung der Grundgesamtheit unterscheidet. Aber ich hab eben keine Ahnung, ob dieser Schluss zulässig ist Augenzwinkern Danke auch für den Link, ich werde mir alles in Ruhe durchlesen.

LG
Namenloser325 Auf diesen Beitrag antworten »

Generell gibt es natürlich Voraussetzungen unter welchen statistische Tests anwendbar sind. Chi-Quadrat-Tests gehen von einer Normalverteilung aus. Die ist natürlich bei einer diskreten Verteilung mit zwei Werten nicht gegeben. Eine breitere Anwendbarkeit gewinnt der Test unter Verwendung des zentralen Grenzwertsatzes, aus welchem folgt, dass Mittelwerte von n unabhängig und gleich verteilten Zufallsvariablen gegen eine Normalverteilung konvergieren für n -> unendlich.
Chanel123 Auf diesen Beitrag antworten »

Hey Namenloser,
der Chi-Quadrat-Homogenitätstest ist für kategoriale Variablen anwendbar.
So ist unter methodenberatung.uzh.ch (ich kann den kompletten Link leider nicht angeben, weil ich nur als Gast angemeldet bin) >Datenanalyse mit SPSS>Unterschiede>Proportionalität und Häufigkeiten>Pearson Chi^2 zu lesen:

" [...] Dieser Test wird auch als "Chi-Quadrat-Anpassungstest" (engl. "Goodness of fit test"), "Chi-Quadrat-Homogenitätstest" oder "Einstichproben-Chi-Quadrat-Test" bezeichnet.
Die Fragestellung dieses Chi-Quadrat-Tests wird oft so verkürzt: "Unterscheidet sich die beobachtete Häufigkeitsverteilung von einer erwarteten Häufigkeitsverteilung?" [...] "

Und unter Kapitel 2.2:
"2.2. Voraussetzungen
✓ Die Variable ist kategorial (nominal- oder ordinalskaliert)
✓ Die erwartete Häufigkeit in jeder Kategorie muss mindestens 1 betragen. Bei höchstens 20% der Kategorien darf die erwartete Häufigkeit unter 5 liegen, damit die Teststatistik näherungsweise einer Chi-Quadrat-Verteilung folgt"

Also theoretisch müsste das Vorgehen, dass ich gewählt habe, passend sein, oder?

LG
Namenloser324 Auf diesen Beitrag antworten »

Ja, prinzipiell sollte der zentrale Grenzwertsatz hier anwendbar sein. Die Frage ist aber wieso du das machen möchtest. Es ist eine Binomialverteilung und du kannst exakte Konfidenzintervalle berechnen (denn du sagst du kennst die wahre Verteilung). Wieso du eine Approximation machen möchtest (die hier durchaus sehr gut sein kann) ist mir unklar.
 
 
Chanel123 Auf diesen Beitrag antworten »

Ok danke, ich probier einfach alles aus und schaue, ob ich verschiedene Ergebnisse bzgl. Signifikanz erhalte. Wenn bei allen Methoden kein signifikanter Unterschied vorherrschend ist, ist die Sache ohnehin klar. smile Danke!
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »