Ergebnisse K+S-Test & chi²-Test aus XLSTAT vs eigener Berechnung

Neue Frage »

MaVeRiC Auf diesen Beitrag antworten »
Ergebnisse K+S-Test & chi²-Test aus XLSTAT vs eigener Berechnung
Hallo liebe User,

ich habe ein Problem mit dem Kolmogorov-Smirnov-Test und chi²-Test. Ich möchte folgende Daten auf Normalverteilung mit den beiden Tests prüfen - sprich H0="Daten sind normalverteilt":

16,38%
2,33%
-4,56%
11,72%
11,11%
15,50%
-3,87%
4,86%
2,13%
51,96%
13,24%
-6,49%
-3,93%
6,73%
4,76%
8,98%
5,70%
47,91%
42,23%
34,55%
9,51%

Mittelwert= 12,89%
Standardabweichung= 17,07%
Signifikanzniveau= 5%

Dafür habe ich zum einen die Test mittels dem Excel-Addin XLSTAT (ist ja bestimmt allg. bekannt - google "XLSTAT") und selber in Excel berechnet. Die Ergebnisse sind die gleichen, nur die Interpretation ist eine andere:

1. Kolmogorov-Smirnov-Test

Eigene Berechnung:

Dabei komme ich auf folgendes Ergebnis:

D = 0,22847.

Für Signifikanzniveau= 5% bei N=21 (da 21 Werten) komme ich nach den offiziellen Tabellen auf einen p-Wert (siehe Z.B.: "darf leider keine URLs Posten, obwohl ich angemeldet bin - einfach in google "kolmogorov smirnov tabelle kritische werte" eingeben) von 0,28724. Da mein D-Wert kleiner ist, kann ich die H0 annehmen. Sprich: Daten sind normalverteilt.

Ergebnis aus XLSTAT

Kolmogorov-Smirnov-Test:
D = 0,228
p-Wert = 0,1909
alpha = 0,05

Testinterpretation:
H0: Die Stichprobe folgt einer Normal-Verteilung
Ha: Die Stichprobe folgt keiner Normal-Verteilung
Da der berechnete p-Wert größer als das Signifikanz-Niveau alpha=0,05 ist, kann die Null-Hypothese H0 bestätigt werden.

Das Risiko die Null-Hypothese H0 zurückzuweisen, obwohl sie wahr ist, beträgt 19,09%.

Frage dazu

Dieses Ergebnis kann ich nicht nachvollziehen. Wie kommt XLSTAT auf einen Wert von 0,1909? Ich kann diesen Wert in keiner Tabelle finden.

Außerdem habe ich gelernt, dass wenn D > P ist, dann wird die H0 (Wert ist normalverteilt) abgelehnt. Hier wird sie jedoch angenommen? Ich komme zwar zum selben Ergebnis in der Interpretation, aber warum dreht XLSTAT das hier um bzw. woher kommen die 0,1909?


2. Chi²-Test

Eigene Berechnung:

Ich komme auf folgendes Ergebnis:

xi²=34,6825
xi²-Wert bei Signifikanzniveau= 5% und 12 Freiheitsgraden über die Formel "=+CHIQU.INV.RE(0,05;12)" ermittelt = 21,02607.

Daraus folgt, dass die H0 abgelehnt wird, da mein xi² höher als das xi² der Verteilung

Ergebnis aus XLSTAT

Chi-Quadrat-Test:

Chi-Quadrat (Beobachteter Wert) = 33,588
Chi-Quadrat (Kritischer Wert) = 21,026
FG = 12
p-Wert = 0,0008
alpha = 0,05

Testinterpretation:
H0: Die Stichprobe folgt einer Normal-Verteilung
Ha: Die Stichprobe folgt keiner Normal-Verteilung
Da der berechnete p-Wert kleiner als das Signifikanz-Niveau alpha=0,05 ist, muss die Null-Hypothese H0 zurückgewiesen werden und die alternative Hypothese Ha akzeptiert werden.

Das Risiko die Null-Hypothese H0 zurückzuweisen, obwohl sie wahr ist, ist geringer als 0,08%.

Frage dazu

Warum dreht XLSTAT den p-Wert hier nochmals um (entspricht in Excel der Formel =+CHIQU.VERT.RE(33,588;12) - soviel habe ich schon rausgefunden) und wieso wird dann auch die Interpretation der Hypothese umgedreht?

Ich habe schon in der Hilfe von XLSTAT und im Internet versucht herauszufinden, die die Software bei dem Test vorgeht. Ich habe das Internet durchsucht, aber irgendwie bin ich nicht fündig geworden?

Könnten ihr mir hier weiterhelfen, bin fast am verzweifeln! traurig

Über eine Rückmeldung würde ich mich riesig freuen und möchte mich bereits im Voraus für eure Hilfe bedanken! Gott Gott

Viele Grüße
*mAv*
HAL 9000 Auf diesen Beitrag antworten »
RE: Ergebnisse K+S-Test & chi²-Test aus XLSTAT vs eigener Berechnung
Zitat:
Original von MaVeRiC
Warum dreht XLSTAT den p-Wert hier nochmals um (entspricht in Excel der Formel =+CHIQU.VERT.RE(33,588;12)

Wir haben hier bei dieser -verteilten Testgröße einen ausschließlich rechtsseitigen Ablehnungsbereich, dort ergibt sich als p-Wert des Tests bei beobachtetem Testgrößenwert

,

wenn man mit die Verteilungsfunktion der Testgröße bei Vorliegen bezeichnet, siehe Wikibeitrag "P-Wert". Bei anderen Ablehnungsbereichen (nur links bzw. zweiseitig) sieht es anders aus.
MaVeRiC Auf diesen Beitrag antworten »
RE: Ergebnisse K+S-Test & chi²-Test aus XLSTAT vs eigener Berechnung
Hallo HAL 9000,

vielen Dank für deine Antwort und die damit verbundene Mühe.

Wie stellst Du fest, dass ich hier einen rechtsseitigen Ablehnungsbereich habe und entsprechend den Wert nochmals "umdrehen" muss?


@All:

Ich habe bemerkt, dass ich oben bei dem K+S-Test wohl etwas durcheinander gebracht habe. Der p-Wert entspricht ja nicht dem kritischen Wert. D.h. die beiden Werte können ja nicht gleich sein. Die Frage ist dann eher, wie ermittle ich denn den P-Wert bei einem K+S-Test in Excel. Weiß das jemand?

VG und vielen Dank!

Kai
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von MaVeRiC
Wie stellst Du fest, dass ich hier einen rechtsseitigen Ablehnungsbereich habe

Weil das bei Chiquadrat-Anpassungstest schlicht so ist, per Konstruktion der Testgröße!

Und bei KS genauso: Je stärker die Verteilung von der zu testenden Vorgabe abweicht, desto größere Werte nimmt die Testgröße an. Logisch, dass da die Nullhypothese nur bei großen Werten der Testgröße abgelehnt wird (also rechts), und nicht etwa bei kleinen.
MaVeRiC Auf diesen Beitrag antworten »

Hallo HAL 9000,

vielen Dank für deine schnelle Antwort. Weißt Du jetzt zufällig noch, wie ich den P-Wert in Excel für den K+S-Test berechne? Habe da keine Funktion gefunden.

VG

Kai
MaVeRiC Auf diesen Beitrag antworten »

Keiner eine Idee?
 
 
Huggy Auf diesen Beitrag antworten »

Excel (jedenfalls meine schon ältere Version) hat keine Funktionen für die K+S-Verteilung oder zur Bestimmung der kritischen Werte für den K+S-Test. Daher kann man damit auch keine p-Werte für den Test bestimmen.

Wenn man Tabellen der kritischen Werte des K+S-Tests für verschiedene hat, kann man daraus den p-Wert durch Interpolation ungefähr ablesen. Aus einer Tabelle für lese ich z. B. einen kritischen Wert bei von ab. Das entspricht ziemlich gut deinem beobachteten D. Der p-Wert muss also knapp unter liegen, was mit der Angabe von XLSTAT übereinstimmt.

Dein Chi^2-Test kommt mir merkwürdig vor. Du gibst dafür 12 Freiheitsgrade an. Dann müsstest du den Datenbereich in 15 Intervalle unterteilt haben. Das sind aber zu viele für lediglich 21 Datenpunkte. Es gibt ja die Empfehlung für den Test, dass jedes Intervall mindestens 5 Datenpunkte enthalten sollte.
MaVeRiC Auf diesen Beitrag antworten »

Lieber Huggy,

vielen Dank für deine Rückmeldung. Bitte entschuldige meine verspätete Rückmeldung.

Das mit der Anzahl der Klassen ist ein guter Hinweis. Das muss ich dann nochmal justieren und in der Literatur nach einer Quelle dazu suchen. Heißt ja dann bei 21 Datenpunkten -> -> 4 Klassen

Ich habe jetzt jedoch nicht nachvollziehen können, wir auf den p-Wert aus der Tabelle für Kritische Werte ableitest. Wie kommst Du denn zu der Aussage, der p-Wert muss unter 0,2 liegen? Könntest Du mir die Schritte vllt erläutern?

Über eine kurze Rückmeldung würde ich mich sehr freuen

Vielen Dank für deine Mühe

*mav*
Huggy Auf diesen Beitrag antworten »

Der p-Wert ist dasjenige Signifikanzniveau, bei dem der beobachtete Wert der Testgröße gleich dem kritischen Wert der Testgröße ist. Dein beobachteter Wert ist 0.228. Das ist schon fast gleich dem kritischen Wert von 0.226 für das Signifikanzniveau 0.2. Um den kritischen Wert noch etwas größer zu machen, muss man das Signifikanzniveau etwas kleiner machen.
MaVeRiC Auf diesen Beitrag antworten »

Hallo Huggy,

super - vielen Dank für deine Antwort. Jetzt habe ich es kapiert. Dann versuche ich das mal mittels kubischer Splines zu interpolieren.

Hast mir sehr geholfen!
Huggy Auf diesen Beitrag antworten »

Zu deinen PN-Fragen:

(1) Die Klassenbreiten beim ChQ-Test müssen nicht gleich sein. Es ist durchaus üblich, benachbarte Klassen zu einer Klasse zusammenzufassen, wenn die Häufigkeiten sonst nicht den Empfehlungen dazu entsprechen würden.

(2) Die Zahl der Freiheitsgrade errechnet sich zu Zahl der Klassen minus 1 minus Zahl der aus der Stichprobe geschätzen Parameter der Verteilung. Da du die beiden Parameter der Normalverteilung aus der Stichprobe geschätzt hast, ist deine Zahl der Freihieitsgrade gleich Zahl der Klassen minus 3.
MaVeRiC Auf diesen Beitrag antworten »

Der Vollständigkeit halber anbei noch die PN-Fragen und natürlich vielen lieben Dank an Huggy!

Zitat:
Hallo Huggy,

ich habe deine Anregung mit dem den 5 Werten in einer Klasse bei dem Chi² aufgenommen und mich auch noch mal in der Literatur schlau gemacht. Du hast natürlich Recht und super, dass Du mich darauf hingewiesen hast.

In Hofstätter/Wendt - Quantitative Methoden der Psychologie Band 1 finde ich dazu auf S. 69 folgendes: "Als Faustregel gilt: in keiner Klasse sollte die erwartete Häufigkeit kleiner als 5 sein, oder etwas großzügiger: Nicht mehr als 20% der erwarteten Häufigkeiten dürfen unter 5liegen, und keine unter 1"

Für meine Arbeit würde ich gerne die etwas großzügigere Regel in in Anspruch nehmen. Um das umzusetzen habe ich noch zwei Fragen an Dich, wenn das okay wäre:

1. Müssen die Klassen bei einem Chi²-Test immer die gleiche Klassenbreite haben? Oder können die Klassenbreiten variieren? Z.B. eine Klasse hat die Breite von 5, die andere von 10 usw. Wenn dem nicht so ist, bekomme ich das mit der Anforderung an den Chi²-Test nicht hin.

2. Wie komm ich denn auf die Freiheitsgrade? Du hast ja gleich darauf geschlossen, dass ich bei 12 Freiheitsgraden 15 Klassen gebildet habe. Auch XLSSTAT zieht immer genau 3 Freiheitsgrade ab. Woher kommt das? Ich werde da auch aus der Literatur nicht schlau.



Dann noch eine kurze Nachfrage zu 2. Mit den beiden geschätzten Parametern meinst Du den Mittelwert und die Standardabweichung?
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von MaVeRiC
Dann noch eine kurze Nachfrage zu 2. Mit den beiden geschätzten Parametern meinst Du den Mittelwert und die Standardabweichung?

Ja.
MaVeRiC Auf diesen Beitrag antworten »

Ich muss leider nochmals zwei Sachen aufgreifen Hammer .

Das eine Betrifft die aussagen von XLSSTAT:

Zitat:

1. Kolmogorov-Smirnov-Test

Ergebnis aus XLSTAT

Kolmogorov-Smirnov-Test:
D = 0,228
p-Wert = 0,1909
alpha = 0,05

Testinterpretation:
H0: Die Stichprobe folgt einer Normal-Verteilung
Ha: Die Stichprobe folgt keiner Normal-Verteilung
Da der berechnete p-Wert größer als das Signifikanz-Niveau alpha=0,05 ist, kann die Null-Hypothese H0 bestätigt werden.

Das Risiko die Null-Hypothese H0 zurückzuweisen, obwohl sie wahr ist, beträgt 19,09%.


2. Chi²-Test

Ergebnis aus XLSTAT

Chi-Quadrat (Beobachteter Wert) = 33,588
Chi-Quadrat (Kritischer Wert) = 21,026
FG = 12
p-Wert = 0,0008
alpha = 0,05

Testinterpretation:
H0: Die Stichprobe folgt einer Normal-Verteilung
Ha: Die Stichprobe folgt keiner Normal-Verteilung
Da der berechnete p-Wert kleiner als das Signifikanz-Niveau alpha=0,05 ist, muss die Null-Hypothese H0 zurückgewiesen werden und die alternative Hypothese Ha akzeptiert werden.

Das Risiko die Null-Hypothese H0 zurückzuweisen, obwohl sie wahr ist, ist geringer als 0,08%.


Ich habe Probleme die kursiven Aussagen zu interpretieren. Bei dem Chi²-Test macht die Aussage Sinn. Die H0 wird verworfen. Das "Risiko" die H0 zu fälschlicherweise zu verwerfen, obwohl sie richtig ist, beträgt 0,08%. Verstanden.

Die Aussage beim K+S-Test versteh ich jedoch nicht. Die H0 wird hier doch gar nicht verworfen. Wieso habe ich dann ein Risiko dies doch zu tun?

---------------------------------------------------------------------------------------------------

Zweites Thema.

Wenn ich meine Stichprobe mittels beiden Test auf eine Normalverteilung und eine Dreiecksverteilung teste und beispielsweise folgende Ergebnisse herausbekomme:

Normalverteilung:

K+S:
D (Beobachteter Wert) = 0,22
D (Kritischer Wert) = 0,28

Chi-Quadrat
Chi-Quadrat (Beobachteter Wert) = 14,5
Chi-Quadrat (Kritischer Wert) = 21,02

Gleichverteilung:

K+S:
D (Beobachteter Wert) = 0,26
D (Kritischer Wert) = 0,28

Chi-Quadrat
Chi-Quadrat (Beobachteter Wert) = 18,7
Chi-Quadrat (Kritischer Wert) = 21,02

Kann ich dann sagen, dass zwar beider Verteilungen passen, aber die Normalverteilung besser passt, da Differenzen zwischen kritischem Wert und beobachtetem Wert höher sind?


Über eine Rückmeldung freue ich mich wie immer sehr und bedanke mich gleich im Voraus für eure Mühe. Gott Gott Gott

VG

Kai
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von MaVeRiC
Ich habe Probleme die kursiven Aussagen zu interpretieren. Bei dem Chi²-Test macht die Aussage Sinn. Die H0 wird verworfen. Das "Risiko" die H0 zu fälschlicherweise zu verwerfen, obwohl sie richtig ist, beträgt 0,08%. Verstanden.

Die Aussage beim K+S-Test versteh ich jedoch nicht. Die H0 wird hier doch gar nicht verworfen. Wieso habe ich dann ein Risiko dies doch zu tun?

Diese Aussagen sind so zu verstehen: Wenn man aus einer Normalverteilung (also Nullhypothese richtig) wiederholt Stichproben vom Umfang deiner Stichprobe zieht und dann für jede Stichprobe die Testgröße berechnet, dann wird bei ca. einem Anteil der Stichproben die Testgröße größer oder gleich der bei deiner Stichprobe beobachteten Testgröße sein. Oder etwas mehr mathematisch:



Das heißt, mit einer Wahrscheinlichkeit p wird bei einer solchen wiederholten Stichprobennahme die Nullhypothese abgelehnt, obwohl sie richtig ist, wenn man den kritischen Wert setzt. Das ist völlig unabhängig davon, ob es bei deiner konkreten Stichprobe tatsächlich zu einer Ablehnung der Nullhypothese kommt. Denn die tatsächliche Ablehnung hängt ja von der einigermaßen willkürlichen Wahl des Signifikanzniveaus ab. Deshalb ist die Angabe des p-Werts so nützlich. Dann kann ein Leser der Untersuchung selbst entscheiden, ob er eine eventuelle Ablehnung der Nullhypothese für sinnvoll hält oder nicht. Er mag ja ein anderes Signifikanzniveau für angemessen halten als der Autor der Untersuchung.

Zitat:
Kann ich dann sagen, dass zwar beider Verteilungen passen, aber die Normalverteilung besser passt, da Differenzen zwischen kritischem Wert und beobachtetem Wert höher sind?

"besser passt" ist eine akzeptable Aussage. Man muss sich aber davor hüten, daraus eine Wahrscheinlichkeitsaussage zu machen. Die Normalverteilung ist wahrscheinlicher als die Gleichverteilung wäre vorsichtig ausgedrückt eine unsolide Aussage und hart ausgedrückt Unfug, weil es dafür gar keine Wahrscheinlichkeit gibt.
MaVeRiC Auf diesen Beitrag antworten »

Super Huggy. Warum steht das in den Fachbüchern nicht einfach so drinnen, dann würde es jeder verstehen. Freude

Ich habe übrigens den P-Wert über Interpolieren mit kubischen Splines in Excel bestimmen können.

Danke Dir auch hier für den Tipp!
Huggy Auf diesen Beitrag antworten »

Zunächst mal Danke für dein Lob. Das schlecke ich genüsslich, wie der Bär den Honig.

Weshalb erklären Bücher das nicht so? Das frage ich mich auch oft. Aber es ist eine ungerechte Frage. Egal wie man eine Sache erklärt, es gibt immer Leute, die aus einem anderen Blickwinkel auf die Sache schauen und denen aus ihrem Blickwinkel die Erklärung nicht einleuchtet.

Letztlich bleibt es Aufgabe des Lesers, sich intensiv mit Definitionen und Erklärungen auseinanderzusetzen, hin- und herzuwälzen, wie man sie auch anders formulieren könnte, was sie bedeuten und was sie nicht bedeuten. Nur durch diese intensive Auseinandersetzung gewinnt man wahres Verständnis. Wie halt schon der Volksmund sagt: Ohne Fleiß kein Preis!
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »