Bedeutung des Korrelationskoeffizienten |
06.01.2010, 12:10 | Linnert | Auf diesen Beitrag antworten » |
Bedeutung des Korrelationskoeffizienten mir bereitet der Korrelationskoeffizient nach Pearson Kopfzerbrechen. Ich weiss zwar, wie er definiert ist (Kov(x,y)/( sqrt(Var(x))*sqrt(Var(y)) ) und was er aussagen soll (Maß für die Ähnlichkeit oder Maß für linearen Zusammenhang), aber ich kann das leider an der mathematischen Definition nicht erkennen. Kann mir jemand anhand der mathematischen Definition die Bedeutung des Korrelationskoeffizienten erklären? Es ist unbefriedigend, den Korrelationskoeffizienten ausrechnen zu können, aber nicht zu verstehen, warum er etwas aussagt. Vielen Dank! |
||
06.01.2010, 12:19 | wisili | Auf diesen Beitrag antworten » |
RE: Bedeutung des Korrelationskoeffizienten Ich hätte eine Analogie anzubieten. Sie setzt aber voraus, dass du Vektorgeometrie etwas kennst. Könntest du den Zwischenwinkel (es genügt sein Cosinus) zweier Vektoren im 3-dimensionalen Raum berechnen? Wenn ja, tu das doch mal mit x = (x1,x2,x3) und y = (y1,y2,y3) und deute hernach x und y als Stichproben bzw. genauer als deren Abweichungen vom Mittelwert. |
||
06.01.2010, 15:04 | Linnert | Auf diesen Beitrag antworten » |
schön! Das ist eine gute Analogie! Sieht man die einzelnen Einträge des Vektors jeweils als einen Messwert und teilt in den Varianzen und in der Kovarianz noch durch die Dimension des Vektors, so kommt man direkt zum Empirischen Korrelationskoeffizienten. Sieht man x und y jeweils nur als eine Stichprobe, so kommt man zwar nicht direkt zum Korrelationskoeffizienten (weder zu dem nach Pearson, noch zum Epirischen), aber die Form der Definition wird trotzdem sichtbar (so versteh ich das jedenfalls). Danke!! |
||
06.01.2010, 15:22 | wisili | Auf diesen Beitrag antworten » |
RE: schön! Wenn die Kovarianz (= das Skalarprodukt!) 0 wird, stehen die Vektoren senkrecht, also am wenigsten parallel. Die Division dient der Skaleninvarianz (eine Aenderung der Messeinheit(en) hat zwar Einfluss auf die Kovarianz, aber sollte keinen Einfluss auf die Korrelation (die eine reine Zahl, ohne Masseinheit ist) haben). Der Korrelationskoeffizient ist also sozusagen der Cosinus des Winkels zwischen den beiden Messwertvektoren in einem beliebig hochdimensionalen Vektorraum. (Genauer: Messwertdifferenzen zum Mittelwert, denn sonst hätte man wieder Skalenabhängigkeit, diesmal bezüglich Ursprung) |
|