t-Test mit hypothetischer Differenz der Mittelwerte

Neue Frage »

BeeAgeMedia Auf diesen Beitrag antworten »
t-Test mit hypothetischer Differenz der Mittelwerte
Meine Frage:
Hallo!

Ich habe eine prinzipielle Verständnisfrage zum t-Test und zwar für den speziellen Fall, wenn eine hypothetische Differenz der Mittelwerte größer 0 vorgegeben wird. Ich möchte für die Diskussion ausdrücklich auf den entsprechenen Wikipedia-Artikel verweisen (http://de.wikipedia.org/wiki/Zweistichproben-t-Test).

Die Nullhypothese wird dort mit xq - yq = w0 aufgestellt und in der Teststatistik entsprechend der Term xq - yq - w0 für die Differenzabfrage der Mittelwerte angeführt (wobei xq und yq die Mittelwerte der Gruppen und w0 die hypothetische Differenz der Mittelwerte darstellt).
Jetzt die Frage: ist diese Darstellung, bzw. die Hypothese so wirklich korrekt oder ist eine Vorzeichenbetrachtung des Terms xq - yq notwendig?


Ein konkretes Beispiel: Vergleich zweier Gruppenmittelwerte bei hypothetischer Differenz von 0,5 ("Die MW unterscheiden sich um 0,5")




Gruppe 1: xq = 5,5 ; s1 = 0,53 ; n1 = 8
Gruppe 2: yq = 6,5 ; s2 = 0,53 ; n2 = 8
w0 = 0,5
alpha = 0,05

-> tkrit = 2,145

-> tprüf = -5,612
-> |tprüf| > tkrit, also kann man die Nullypothese ablehnen, die Gruppenmittelwerte unterscheiden sich um 0,5.

Jetzt mein ABER: dieses Ergebnis kommt nur zustande, weil Gruppe 1 und Gruppe 2 willkürlich festgelegt wurden (der Term xq - yq - w0 ergibt in diesem Fall -1,5).
Würde man die Gruppen, bzw. oder xq und yq tauschen, ergäbe der Term yq - xq - w0 den Wert 0,5. Damit wäre tprüf = 1,871 und -> |tprüf| < tkrit, die Nullypothese könnte in diesem Fall also nicht abgelehnt werden, die Mittelwerte unterscheiden sich nicht.

Eines der beiden Ergebnisse ist offenbar nicht korrekt. Was ist also im Fall w0 > 0 zu tun?

Meine Ideen:
Ich hatte in erster Näherung überlegt, ob man prinzipiell mit dem Betrag |xq - yq| - w0 rechnen muss? Dies scheint mir logisch, da somit die (positive) Differenz durch das vorgegebene w0 verkleinert und in Folge die Ablehnung der Nullhypothese erschwert wird.

Liege ich da falsch? Leider finde ich in verschiedenster Literatur keine Hiweise.


Zum Hintergrund meines Problems: in technischen Fragestellungen will man meistens die Größe des Unterschieds untersuchen. Umgekehrt will man bei technischen Entwicklungen definierte Fortschritte (z.B. "Ist unser neues Produkt um 10 km/h schneller?") machen. Die reine Aussage, OB ein Unterschied besteht, reicht meistens nicht aus. Daher sollte vor Tests auch eine Umfangsplanung gemacht werden, in welche eine Differenz der Mittelwerte (als Effektgröße) einfließt.


Vielen Dank für eure Hilfe!

Bernd
BeeAgeMedia Auf diesen Beitrag antworten »
RE: t-Test mit hypothetischer Differenz der Mittelwerte
Huhu ... keiner eine Idee?
:-)

Nochmal meine Frage in einem Satz formuliert: Wenn in einem t-Test auf eine vorgegebene Differenz der Mittelwerte geprüft werden soll, wie muss dann der Term der Teststatistik aussehen?

So?


Oder so?



Danke nochmal im Voraus für eine erleuchtende Antwort!

Bernd
Huggy Auf diesen Beitrag antworten »
RE: t-Test mit hypothetischer Differenz der Mittelwerte
Nur die erste Form ist richtig, wenn die Nullhypothese in Worten heißt, die X-Gesamtheit hat einen um größeren Mittelwert als die Y-Gesamtheit. Wenn man die Bezeichnungen der beiden Gesamtheiten tauscht, wie oben diskutiert, ändert sich am Testergebnis nichts, weil man dann auch die beobachteten Daten den umbenannten Gesamtheiten zuordnen muss.

Die zweite Form würde zu einer Nullhypothese gehören, die in Worten lautet, entweder hat die X-Gesamtheit einen um größeren Mittelwert als die Y-Gesamtheit oder die Y-Gesamtheit hat einen um größeren Mittelwert als die X-Gesamtheit. Man müsste dann 2 getrennte Rechnungen in der ersten Form machen und deren -Fehler addieren. Eine Nullhypothese dieser Art scheint mir für ziemlich unsinnig.
BeeAgeMedia Auf diesen Beitrag antworten »
RE: t-Test mit hypothetischer Differenz der Mittelwerte
Vielen Dank für die Antwort, Huggy - das leuchtet soweit ein!

Nochmal zur Absicherung meines Verständnisses: die X-Gesamtheit muss bei der Berechnung als die Datengruppe mit dem größeren Mittelwert definiert werden!? Liege ich da richtig?

Vielleicht habe ich auch grundsätzlich ein Verständnisproblem ... den gegebenen Term verwende ich schon, um zu prüfen, ob z.B. meine Gruppe 1 sich um mindestens von Gruppe 2 unterscheidet, oder?!
Und wenn ich den Term ohne anwende, untersuche ich die beiden Gruppen lediglich auf einen Unterschied (wie groß der auch immer sein mag)!?

Danke!
Huggy Auf diesen Beitrag antworten »
RE: t-Test mit hypothetischer Differenz der Mittelwerte
Zitat:
Original von BeeAgeMedia
Nochmal zur Absicherung meines Verständnisses: die X-Gesamtheit muss bei der Berechnung als die Datengruppe mit dem größeren Mittelwert definiert werden!? Liege ich da richtig?

Nein, überhaupt nicht. Das ist ja auch bei deinem Beispiel nicht der Fall. Ich versuche es mal an einem Beispiel ganz ausführlich zu erläutern und verwende dabei deine Zahlen.

Es gebe die Erfahrung, dass der Ertrag von Pflanzen aus einer bestimmten Pflanzengruppe bei Düngung mit einem bestimmten Dünger um (Dimension lasse ich weg) zunimmt gegenüber ungedüngten Pflanzen. Nun tauchen Zweifel auf, ob das auch bei einer bestimmten Pflanze aus dieser Gruppe gilt, für die bisher keine Erfahrungen vorliegen. Man beschließt, einen Versuch zu machen und diesen mit einem Hypothesentest auszuwerten.

Es ist gute Praxis, in solchen Fällen den Hypothesentest in allen Details festzulegen, bevor die Versuchsergebnisse vorliegen. Das hat nichts mit Mathematik zu tun, sondern mit Psychologie. Legt man die Testdetails erst fest, nachdem man die Versuchsergebnisse hat, besteht die psychologische Gefahr, dass man - bewusst oder unbewusst - die Testdetails so konzipiert, dass der Test das erhoffte Ergebnis liefert.

Also fragt man sich zunächst, was man wissen möchte. Drei Möglichkeiten liegen nahe:
(1) der Test soll Alarm schlagen, wenn das Versuchsergebnis signifikant von der bisherigen Differenz 0,5 abweicht
(2) der Test soll Alarm schlagen, wenn das Versuchsergebnis signifikant von der bisherigen Differenz 0,5 nach oben abweicht
(3) der Test soll Alarm schlagen, wenn das Versuchsergebnis signifikant von der bisherigen Differenz 0,5 nach unten abweicht

Die drei Möglichkeiten lassen sich als Nullhypothesen in Worten so formulieren:
(1) Ertrag mit Dünger - Ertrag ohne Dünger = 0.5
(2) Ertrag mit Dünger - Ertrag ohne Dünger >= 0.5
(3) Ertrag mit Dünger - Ertrag ohne Dünger <= 0.5
Natürlich könnte man die Sache auch so formulieren:
(1) Ertrag ohne Dünger - Ertrag mit Dünger = -0,5
(2) Ertrag ohne Dünger - Ertrag mit Dünger <= -0,5
(3) Ertrag ohne Dünger - Ertrag mit Dünger >= -0,5

Man darf sich bei der Formulierung zunächst nicht an willkürlichen gewählten Bezeichngen (X, Y oder sonst was) orientieren, sondern an der inhaltlichen Festlegung, was man denn wissen/testen möchte. Nehmen wir an, wir entscheiden uns für (1) in der oberen Formulierung. Dann liegt unsere Nullhypothese fest:
Ertrag mit Dünger - Ertrag ohne Dünger = 0.5
Nun kann man der Bequemlichkeit halber Kurzbezeichnungen einführen, z. B.
X = Ertrag mit Dünger, der Populationsmittelwert
Y = Ertrag ohne Dünger, der Populationsmittelwert
Mit diesen Kurzbezeichnungen lautet die Nullhypothese

Es sollte auch klar sein, wie sich die Nullhypothese formal (aber nicht inhaltlich) ändert, wenn man andere Kurzbezeichnungen wählt.
Nun gilt es noch, das Signifikanzniveau festzulegen, z. B. .

Jetzt wird der Versuch durchgeführt und die Stichprobenmittelwerte des Versuchs seien und , Standardabweichungen und Stichprobenumfang analog gleich deinen Zahlen. Nun kann, wie von dir gemacht, und berechnet werden mit dem Ergebnis, die Nullhypothese ist auf dem gewählten Signifikanzniveau abzulehnen. Das Stichprobenergebnis ist unerwartet. Man hätte erwartet, tatsächlich hat man beobachtet. An der Art der Durchführung des Tests ändert das nichts.

Zitat:
Vielleicht habe ich auch grundsätzlich ein Verständnisproblem ... den gegebenen Term verwende ich schon, um zu prüfen, ob z.B. meine Gruppe 1 sich um mindestens von Gruppe 2 unterscheidet, oder?!

Nein! So wie du den Test durchgeführt hast, ist es ein Test auf die Nullhypothese der Form (1). Du bist (bis auf eine kleine numerische Ungenauigkeit, ich komme auf ) mit in die Verteilung gegangen, hast also einen zweiseitigen Test durchgeführt. Mindestens würde einen einseitigen Test gemäß (2) bedeuten. Man würde dann mit in die t-Verteilung gehen.
Siehe auch: http://de.wikipedia.org/wiki/Zweistichpr...ige_Stichproben

Zitat:
Und wenn ich den Term ohne anwende, untersuche ich die beiden Gruppen lediglich auf einen Unterschied (wie groß der auch immer sein mag)!?

Richtig! Wobei man auch hier auf den Unterschied zwischen ein- und zweiseitigem Test achten muss.


Jetzt hoffe ich mal, dass dir dieses extrem ausführliche Gelabere hilft und dich nicht noch mehr verwirrt.
BeeAgeMedia Auf diesen Beitrag antworten »
RE: t-Test mit hypothetischer Differenz der Mittelwerte
Vielen, vielen Dank - jetzt hab ichs endlich vollständig verstanden! Von wegen Gelabere...das war ein sehr hilfreicher Sermon :-))

Ich denke, das Problem bei statistischen Untersuchungen ist (zumindest bei mir), dass man rudimentäre Grundlagen zwar in Schule und Studium gelernt hat. In der Anwendung benötigt man jedoch eine Paarung aus einem erheblichen Maß an Mathematik und Erfahrung, um einen Test wirklich sauber auslegen zu können. Und ganz ehrlich, die meiste Literatur dazu ist für das zügige Aneignen (neben der restlichen Arbeit, die man ja auch noch zu erledigen hat :-), kaum zu gebrauchen.
Umso besser, dass du es auf den Punkt gebracht und mir somit verständlich gemacht hast.


Grüße von einem zufriedenen t-Tester :-))

Bernd
 
 
Huggy Auf diesen Beitrag antworten »
RE: t-Test mit hypothetischer Differenz der Mittelwerte
Freut mich sehr, dass ich dir helfen konnte.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »