Kovarianz/Korrelation bei ungleich vielen Merkmalsausprägungen

Neue Frage »

Danielsaw Auf diesen Beitrag antworten »
Kovarianz/Korrelation bei ungleich vielen Merkmalsausprägungen
Hallo zusammen,

mir lässt eine Aufgabe in deskriptiver Statistik momentan keine Ruhe.
Der Aufgabentext lautet wie folgt:

Bei einer Untersuchung von 20 Haushalten nach Personenzahl (X) und Anzahl der PKWs (Y) ergab sich folgende ungeordnete Reihe von Beobachtungspaaren:

(1,1) (2,1) (3,2) (1,0) (1,1) (1,1) (2,1) (2,0) (2,2) (1,0) (2,1) (2,1) (1,1) (3,2) (3,1) (4,0) (3,2) (1,1) (4,1) (1,1)

Berechnen Sie die Kovarianz und beurteilen Sie die Korrelation.

Soweit so gut, wenn es nach Schema F laufen würde: Simga xy / Simga x * Simga y
Für Sigma x bekomme ich 1 und für Simga y 0,4 heraus, was laut Lösung aus einem vorhergehenden Aufgabenteil auch richtig ist. Allerdings komme ich partout nicht darauf, wie ich Simga xy ausrechnen soll, wenn für X und Y verschieden viele Merkmalsausprägungen vorliegen. In diesem Fall vier für x (1,2,3,4) und 3 für y (0,1,2). Laut Lösung soll hier 0,237 -> Schwache pos. Korrelation herauskommen.

Ich bin für jede Hilfe dankbar!
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von Danielsaw
Allerdings komme ich partout nicht darauf, wie ich Simga xy ausrechnen soll, wenn für X und Y verschieden viele Merkmalsausprägungen vorliegen.

Erstaunt1
Die Kovarianzberechnung hat doch nichts, überhaupt nichts mit der Anzahl der verschiedenen Merkmalsausprägungen zu tun! Es ist doch

,

und das spielt es nicht die geringste Rolle, wieviel verschiedene bzw. verschiedene es gibt. unglücklich
Danielsaw Auf diesen Beitrag antworten »

Also zunächst einmal vielen Dank, ich konnte die Aufgabe mittlerweile mit Hilfe einer Zentrierung von x lösen.

Allerdings geht mir auch aus deiner Formel nicht hervor, wie ich das mit verschieden vielen Merkmalsausprägungen lösen soll.

Wie errechne ich die Summe von xi*yi, wenn für xi 4 Werte und für yi 3 Werte vorliegen?

x1=1, x2=2, x3=3, x4=4 ; y1=0, y2=1, y3=2, y4=??? (nicht vorhanden)

Summe:

1x0+2x1+3x2+4x???
HAL 9000 Auf diesen Beitrag antworten »

Es sind Datenpaare, von , bis hin zu (wenn ich mal deine Reihenfolge der Datenpaarauflistung übernehme) - ich dachte, das wäre soweit klar?
Danielsaw Auf diesen Beitrag antworten »

Vielen Dank für deine Antwort. Habe hier die 2 Vokabeln Beobachtungswerte und Merkmalsausprägungen falsch auf meine Formeln angewendet. Somit kommt deutliches Licht ins Dunkel.

Allerdings bleibt mir noch die Frage nach deiner Formel, und zwar habe ich herausgefunden, dass es 2 Formeln für die Kovarianz gibt. Einmal deine für einen Schätzwert für die Grundgesamtheit und eimal diese hier: 1/n x (Summe t=1 bis n) von (xi - x quer) x (yi- y quer) für einen speziellen Datensatz. Bei beiden kommen ähnliche Ergebnisse heraus, aber nicht gleiche???
HAL 9000 Auf diesen Beitrag antworten »

Man nimmt den Faktor statt , um Erwartungstreue zu erreichen. Für die Korrelation ist es wichtig, dass man dann auch im Nenner für die dort auftretenden Standardabweichungen und auch die korrigierten Varianzformeln (ebenfalls mit statt ) nimmt.

Tatsächlich ist es zumindest für die Korrelationsberechnung egal, ob man beidesmal (d.h. in Zähler wie Nenner) mit rechnet, oder beidesmal mit , das kürzt sich ja am Ende raus. Für die Kovarianz allein ist es indes von Bedeutung, gerade dann, wenn man einen geringen Stichprobenumfang hat.
 
 
Danielsaw Auf diesen Beitrag antworten »

Vielen Dank für deine Antwort und Hilfe :-)!
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »