Welchen Parametertest nehmen?

Neue Frage »

markus06 Auf diesen Beitrag antworten »
Welchen Parametertest nehmen?
Hallo Statistik-Freunde ;-)

Ich weiß net, welchen Rechenweg ich wählen soll. Als vereinfachtes Beispiel:
Wenn 2mal 30 leute (zufällig ausgewählt) befragt wurden und als Bruttolöhne Mittelwerte für Stadt A von 3000 Euro(Stand.abw. 0,3) und Stadt B von 2000 Euro (Stand.abwe. 0,2) rauskamen.
Wir mit 95% Sicherheit testen sollen, ob der Durschnittslohn in A höher als in B ist,
welchen Test nehme ich da? Ich weiß, dass bei vorhandenen Einzelwerten dies im SPSS mit Mittelwerte vergleichen, t-Test bei unabhängigen Stichproben geht, aber wie schriftlich, nehme ich nun die Formel für den doppelten Erwartungs- oder Anteilstest?

Lieben Gruß
markus
yeti777 Auf diesen Beitrag antworten »
RE: Welchen Parametertest nehmen?
Hallo Markus,

Ich bin selber ein Lernender in der Stochastik. Da sich bis jetzt niemand gemeldet hat, würde ich gerne meine Gedanken zu deiner Aufgabe posten, damit das Problem wieder "aufgewärmt" wird. Vielleicht sieht es dann ein Profi und nimmt Stellung dazu.

Wir haben zwei Städte A und B und zwei gleich grosse Stichproben vom Umfang . Wir nehmen an, die Zufallsvariablen (ZV) und seien normalverteilt mit den unbekannten Erwartungswerten und und den bekannten Varianzen und . Ermittelt wurden die Stichprobenmittelwerte und . Gemäss Theorie sind die Stichprobenmittelwerte wiederum normalverteilte ZVen mit den Varianzen und . Hier habe ich die erste Frage: Diese Varianzen erscheinen mir extrem klein gegenüber den Mittelwerten. Stimmen die Zahlen?

Es soll mit einer statistischen Sicherheit von 95% geprüft werden, ob der Durchschnittslohn in A höher ist, als in B.

Mein Lösungsansatz wäre:
- Die Stichproben sind per definitionem voneinander abhängig (gleiche Länge)
- Nullhypothese :
- Alternative :
- Rückführen des zweiseitigen Parametertests auf einen entsprechenden Test des Hilfsparameters
- ist der Erwartungswert der ZV mit der Varianz
- Neue Nullhypothese :
- Neue Alternative: :
- Als Testvariable nehmen wir die Variable ()
- U ist standardnormalverteilt, da bekannt ist
- Die Nullhypothese (Durchschnittslöhne sind gleich) wird beibehalten, wenn der Wert u der ZV U mit der statistischen Sicherheit von 0.95 in den nicht-kritischen Bereich fällt
- Die Signifikanzzahl ist
-
- Das Quantil c für die standardisierte Normalverteilung ist (Tabelle)
-
- Mit den angegebenen Werten ist und . Man müsste die Nullhypothese also in hohem Bogen verwerfen. Aber irgendetwas stimmt hier doch nicht verwirrt .

Wo ist der Hund begraben? Vermutung: Die angegebenen Varianzen sind viel zu klein. Stochastiker, meldet euch!

Gruss yeti
AD Auf diesen Beitrag antworten »
RE: Welchen Parametertest nehmen?
Die 0.2 bzw. 0.3 sind in der Tat viel zu klein, um auch nur annähernd "realistisch" zu sein. Vielleicht ist mit diesen Werten der Variationskoeffizient gemeint, dann bedeutet 0.2 bei Mittelwert 2000 Euro eine Standardabweichung von 0.2*2000=400 Euro, das klingt schon wesentlich plausibler.

Zu den eigentlichen Tests: Zum Vergleich der Mittelwerte zweier Normalverteilung nimmt man entweder den doppelten t-Test (wenn die Varianzen beider Stichproben einigermaßen gleich sind) oder den sogenannten Welch-Test (auch bei ungleichen Varianzen anwendbar). Letzteren bitte nicht mit dem Elch-Test verwechseln, dass war bei der Mercedes A-Klasse... smile

Vielleicht schlägst du erstmal in deinen Büchern nach diesen Tests nach, bzw. googelst etwas. Wikipedia hat die, glaube ich, auch schon drin.
markus06 Auf diesen Beitrag antworten »
Re: RE: Welchen Parametertest nehmen?
Freut mich, dass sich doch welche dafür interesssieren smile

Die kleinen Standardabweichungen... die stimmen nicht. Sorry, mein Fehler, da fehlt ein "in Tausend Euro", sollen also in Stadt A 300 Euro und in Stadt B 200 Euro sein.

@ yeti
Warum nimmst du die Gleichsetzung und Ungleichung, wegen der gleichen Länge?
Ich hätte ähnlich der Fragestellung als H1: µA > µB und als H0: µA =< µB ausgewählt
Aber dein Lösungsweg sieht sehr interessant aus, einiges habe ich offensichtlich nie berechnet

@ Arthur:
In Spss hatte ich eine Aufgabe mit Vergleich zweier Index-Werte, ob der in Stadt A höher als in Stadt B ist. Das hatte ich mit dem T-Test bei unabhängigen Stichproben verglichen, also die maximale Sicherheit Gamma aus dem SPSS-Report abgelesen. Und das war eigentlich richtig.
In meinem Büchern steht alles so kompliziert drin oder nur das Ergebnis ohne Lösungsweg unglücklich

nagut, falls ich garnichts mehr verstehe, kann ich ja immer noch Testfahrer werden Augenzwinkern die fordern bestimmt nich so viel Statistik-Theorie

ps. Der Luftballon-smileys ist ja nett gemacht :-)
yeti777 Auf diesen Beitrag antworten »
RE: Welchen Parametertest nehmen?
@ Arthur: Herzlichen Dank für deine Tips! Ich werde mich mal im Netz umsehen, jetzt da ich die Stichworte kenne. In meiner bescheidenen Bibliothek werden diese Tests nicht erwähnt (der einfache t-Test schon).
PS. Welches Buch würdest du für
a) die Schätztheorie
b) die Testtheorie
empfehlen? W-Theorie-Kenntnisse auf Basis der Masstheorie sind in bescheidenem Umfang vorhanden (2-semestrige Vorlesung).

@ Markus: Nach der Antwort von Arthur muss ich mich zuerst über das, was er gesagt hat, schlau machen. Wie gesagt, bin ich ein Anfänger in der Stochastik. Habe viel allgemeine Theorie im Rucksack, aber weiss nicht so recht, wie ich sie anwenden soll. Ich bleibe aber dran smile , denn ich finde dieses Gebiet spannend.

Gruss Heinz
yeti777 Auf diesen Beitrag antworten »

@Markus
@Arthur

Ich habe mich in der Zwischenzeit gemäss den Empfehlungen von Arthur etwas im Netz umgesehen und viele Beiträge gefunden. Da die anzuwendenden Formeln mühsam zu schreiben und ich nicht gut in LaTeX bin, beschränke ich mich vorerst darauf, meine Gedanken- und Rechenschritte zu skizzieren. Die Aufgabenstellung ist bekannt, siehe oben.

1. Wir nehmen an, dass die Grundgesamtheiten A und B normalverteilt sind, also und .

2. Da die Varianzen und unbekannt sind, müssen wir zuerst bestimmen, ob gilt oder . Grund: Für nimmt man den doppelten t-Test, für den Welch-Test (wie von Arthur so beschrieben).
Weil der Umfang der beiden Stichproben gleich ist, , sind die Stichprobenvarianzen und verteilt. Als Testvariable nehmen wir jetzt . Nullhypothese : , Alternative . ist gemäss Theorie verteilt. Wir wählen ein Signifikanzniveau von . Dann gilt für das Beibehalten der Nullhypothese . Ich habe nur eine Tabelle für und habe diesen Wert für die Quantile genommen. Für den Annahmebereich erhält man dann . Die Stichprobenvarianzen habe ich, wie Arthur es vorgeschlagen hat, aus den Variationskoeffizienten berechnet:
. Analog erhält man . Für den Wert von Q ergibt sich . Die Nullhypothese ist also abzulehnen und wir müssen von ausgehen. Das bedeutet Welch-Test.

3. Die Testvariable T des Welch-Tests ist t-verteilt mit m Freiheitsgraden. m ist jedoch unbekannt und muss daher geschätzt werden. Ich habe dafür die Näherungsformel von Satterthwaite genommen. Siehe zB. hier: http://www.statsdirect.com/help/parametric_methods/utt.htm. Die Schätzung ergibt .

4. Die Teststatistik für den Welch-Test lautet: , wobei . Die t-Verteilung ist symmetrisch. Mit einem Signifikanzniveau von gilt deshalb .

Für den Wert von t aus unseren Stichprobendaten berechnen wir , wobei :
. Die Nullhypothese (Bruttosaläre sind gleich) ist damit abzulehnen. Die Wahrscheinlichkeit für einen Fehler 1.Art (Irrtumswahrscheinlichkeit beträgt 5%.

Ich weiss nicht, ob ich das Alles richtig durchgezogen habe. Bin für jeden Kommentar oder Richtigstellung dankbar.

Gruss yeti
 
 
markus06 Auf diesen Beitrag antworten »

Erstmal Danke für die ausführlichen Antworten.

@yeti777
Deine Formel hatten wir nie so kompliziert, wir sind gleich mit einer Vereinfachung der Welchformel eingestiegen (ja, ist nicht so sauber und für die Praxis nicht zu empfehlen. Aber in unseren Einfachstbeispielen ging das so schneller zu rechnen)

Gelöst haben wir es dann mit einem unkomplizierten Rechenweg, der in der Praxis aber nicht ganz ausreicht (Varianzhomogenität, Normalverteilung)
Angaben in Tausend Euro (3000 Euro = 3)
Stadt A = x, Stadt B = y

Vereinfachte Formeln für "doppelten Erwartungswert-Test":
T = ( Mx - My ) / S°
T = ( 3 - 2 ) / S°

S° = Wurzel aus [ ( S²x + S²y ) / n ]
S° = Wurzel aus [ ( 0,3² + 0,2² ) / 30 ]
S° = Wurzel aus [ 0,13 / 30 ]
S° = Wurzel aus 0,00433
S° = 0,0658

T= 1 / 0,0658
T = 15,19

hmm, ganz schön groß, aber so das liegt an diesem ganz einfachen Beispiel

Der T estwert ist berechnet, fehlt noch ein V ergleichswert

V = t-Quantil der Ordnung r-2 = t-Quantil der Ordnung 38 auf einem Signifikanzlevel von 0,95
Hierzu hatten wir eine Tafel ("Quantile der t-Verteilung") bekommen, schaue ich also in der Zeile 38 und der Spalte für 0,95 ,dort steht ungefähr 1,68
V= 1,68

Frage ist nach höherem Durschnittslohn, also x > y, die Gegenhypothese x =< y
Deshalb ist der Ablehnungsbereich gegen die Gegenhypothese gegeben, wenn T größer als V ist.
Hier ist T mit ~ 15 > als V.
Deshalb wird die Gegenhypothese abgelehnt, wir konnten also mit 5 % Irrtums-Wahrscheinlichkeit nicht das Gegenteil beweisen.
Dies ist zwar kein definitver Beweis für die Ausgangsfrage ob der Durchschnittslohn in Stadt A > der Stadt B ,aber da die Gegenhypothese abgelehnt ist,
nehmen wir die Nullhypothese an und beantworten wir die Ausgangsfrage positiv.
Also ist in diesem vereinfachtem Beispiel der Durchschnittslohn in Stadt A höher als in Stadt B.

Ich hoffe, diese Ausführungen helfen dem ein oder anderen
Liebe Grüße und ein schönes Wochenende! Wink

P.S.
Die Quantils-Tafel und Formel-Übersichten hatten wir als Kopien bekommen, stehen möglicherweise auch in den Anhängen einiger Statistik-Wälzer.
markus06 Auf diesen Beitrag antworten »

Eine kleine Korrektur, die aber nichts an der Schlussfolgerung ändert.

V = t-Quantil der Ordnung r-2 = t-Quantil der Ordnung 58 auf einem Signifikanzlevel von 0,95
(weil r= m+n = 30 + 30 = 60), somit würde V sogar noch etwas geringer als 1,68

MfG
markus
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »