Chi Quadrat Test auf Normalverteilung

Neue Frage »

DancingWombat Auf diesen Beitrag antworten »
Chi Quadrat Test auf Normalverteilung
Hallo,

ich möchte bei einer Menge von Preisen prüfen ob diese Normalverteilt sind.
Dazu habe ich in Excel mehrere gleichgroße Kategorien gebildet, und die kumulierten Häufigkeiten und Wahrscheinlichkeiten gebildet. Zusätzlich habe ich die erwarteten, kumulierten Häufigkeiten bei Normalverteilung berechnet.
Dabei kam ich auf ein Ergebnis beim Chitest in Excel von annähernd 1 --> Normalverteilt.

Ich stelle mir jetzt die Frage ob es zulässig ist für den Test mit kumulierten Wahrscheinlichkeiten zu arbeiten.

Kann mir dazu jemand etwas sagen? Die Beispiele die ich bisher gefunden habe gehen immer von Einzel- bzw. Klassenwahrscheinlichkeiten aus. Das ist jedoch etwas aufwendiger in Excel durchzuführen.


Grüße,
Sebastian
Zellerli Auf diesen Beitrag antworten »

Normalerweise bildet man, wie du schon geschrieben hast, Klassen für den -Test.

Wenn du jetzt z.B. aus Körpergrößen 180cm bis 189cm mit
180cm 5
181cm 7
182cm 1
183cm 0
184cm 4
185cm 1
186cm 3
187cm 3
188cm 0
189cm 1
(Die Zahl hinter der Größe gibt deren Häufigkeit in der Stichprobe an)

Klassen von mindestens 5 bilden willst, musst du die Häufigkeiten kumulieren.

Klasse1: 180cm; 5
Klasse2: 181cm; 7
Klasse3: 182cm, 183cm, 184cm; 5
Klasse4: 185cm, 186cm, 187cm, 188cm, 189cm; 8

Dein Vergleichswert aus der Theorie kann also nur die entsprechende kumulierte Wahrscheinlichkeit (bzw. Häufigkeit) sein. Es käme auch sonst nichts anderes in Frage. Die Anforderung an den theoretischen Wert ist ganz platt: "Welche Häufigkeit würde man erwarten, hätte man eine Normalverteilung vorliegen?"
Und der theoretische Wert für die Häufigkeit einer Klasse, die gebildet wurde, indem kleinere Klassen kumuliert wurden, ist eben genau der Wert der kumulierten Häufigkeit (berechnet aus der kumulierten Wahrscheinlichkeit).
DancingWombat Auf diesen Beitrag antworten »

Mit kumuliert meinte ich etwas anderes.
Um bei deinem Beispiel zu bleiben:

Körpergröße kleiner gleich | Anzahl

180 | 5
181 | 12
182 | 13
184 | 17
....


Die nachfolgenden Klassen schließen also immer auch die vorherigen mit ein. Die theoretische Verteilung (hier Normalverteilung) kann man ja auch kumuliert bilden.

Die Frage ist halt ob das für den Chi Quadrat Test in der Form zulässig ist oder nicht.
Zellerli Auf diesen Beitrag antworten »

Für den -Test brauchst du meines Wissens disjunkte Klassen (jedes Merkmal taucht in genau einer Klasse auf).

Du kannst aber aus deinen kumulierten Klassen leicht diskunkte bilden, indem du immer die Anzahlen aus den vorhergehenden Klassen addierst und dann von der aktuellen Klasse subtrahierst.

Das bedeutet wiederum, dass die gesamte notwendige Information bereits in deinen kumulierten Klassen enthalten ist, was dann deine Frage (ob das auch ginge) aufwirft...
Dazu sollte man mal die Formel genauer betrachten und herumbasteln. Man sieht dann, dass das nicht stimmt, weil Abweichungen sich wegkürzen können.

Aber jetzt mal genauer (ich mache ein ähnliches Beispiel):

Klasse; disjunkt beobachtet berechnet; kumuliert beobachtet berechnet

180cm; 20 30; 20 30
181cm; 25 15; 45 45
182cm; 15 25; 60 70
183cm; 22 12; 82 82

Man sieht, dass in der Summe für der 1. Summand identisch ist bei kumuliert und disjunkt, der 2. und 4. Summand im kumulierten Fall gleich 0 ist und der 3. Summand im kumulierten Fall kleiner ist als der im disjunkten Fall (im Zähler beide , der Nenner ist aber größer im kumulierten Fall).

Daran sieht man, dass das der Häufigkeiten kumulierter Klassen systematisch kleiner wird als das der Häufigkeiten disjunkter Klassen, weil sich Abweichungen nach unten und nach oben gegenseitig wegheben können, weil vor dem Quadrieren kumuliert, also aufsummiert wird (weshalb es negative Summanden geben kann).
peca Auf diesen Beitrag antworten »
chi test erwartungswert
hallo,
ich brauche dringend eure hilfe.
ich schrebe gerade meine bachelor arbeit über den zusammenhang von hotelbewertungen und sterneklassifizierungen.
hierfür soll ich jetzt mit dem chi test die signifikanz errechnen.
dazu brauche ich bei excel erwartete werte und theoretische werte. ich habe aber nur die spalte mit den theoretischen werten für die kundenbewertungen. also ich habe zb bei booking,com geguckt wie viele punkte von den kunden für verschiedenen hotels vergeben worden sind.
meine frage jetzt: wie komme ich denn an die erwarteten werte dran?

bitte bitte bitte helft mir
danke!!!!
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »