Berechnung von Distanzen

Neue Frage »

student8 Auf diesen Beitrag antworten »
Berechnung von Distanzen
Meine Frage:
Hallo,

könnte mir jemanden erklären, was mit dem folgenden Satz in dem unten angegebenen Link hier gemeint ist:
"Die Streuung der Punktewolke ist in Richtung der Winkelhalbierenden des
ersten Quadranten viel gr¨oßer als in der zu dieser orthogonalen Richtung." ---> steht auf Seite 8

Meine Ideen:
http://www.wiwi.uni-bielefeld.de/~frohn/Mitarbeiter/Handl/mvadiszu.pdf
Ehos Auf diesen Beitrag antworten »

Abbildung 1 veranschaulicht die Tatsache, dass es einen statistischen Zusammenhang zwischen dem Alter der Väter und dem Alter der Mütter der Studenten gibt. Das heißt: Wenn der Vater eines Studenten älter ist als bei anderen, dann ist meist auch dessen Mutter älter und umgekehrt. Lägen alle Punkte exakt auf der Geraden y=x, würde das bedeuten, dass Väter und Mütter bei jedem einzelnen Studenten gleichaltrig sind. Das wäre er Idealfall.
(Bei unterschiedlichen Studenten können die Eltern natürlich andere Alter haben.)

Das andere Extrem wäre die völlige Unabhängigkeit der Alter der Väter und Mütter. In diesem Falle wären die Punkte in Abbildung 1 gleichmäßig über die Fläche verteilt wie ein Sternenhimmel. Das würde bedeuten, dass z.B. die Wahrscheinlichkeit, dass ein Student mit 48-jährigem Vater eine 45-jährige Mutter hat genauso groß ist, als wenn seine Mutter 75 wäre usw. Das ist statistisch unwahrscheinlich.

Die Abbildung 1 hat etwas mit dem Begriff "Korrelationskoeffizient" zu tun. Schaue dir diesen Begriff mal in WIKIPEDIA an. Dort gibt es ein Unterkapitel "Partieller Korrelationskoeffizient".

Der von dir zitierte Satz besagt, dass die Steuung in Richtung der Geraden y=x viel größer ist als in Richtung der senkrechten Geraden y=-x. Das bedeuetet wie gesagt, dass es einen Zusammenhang zwischen den Zufallsgrößen "Alter des Vaters" und "Alter der Mutter" gibt. Beide sind also nicht unabhängig.
student8 Auf diesen Beitrag antworten »

Ich kenne den Begriff „Korrelationskoeffizient“ und ich weiss, was mit ihm gemeint wird. Aber danke nochmal für dein Beispiel zur Veranschaulichung. Ich verstehe schon, dass es einen positiven Zusammenhang gibt und dass diese dann verschwindet in Abbildung 2.

Was ich jetzt aber nicht ganz verstehe ist folgendes:

die Streuung sagt ja soviel aus, wie im Schnitt die einzelnen Werte von dessen Arithmetischen Mittel im Quadrat abweichen(empirische Varianz). Da ich hier zentrierte Werte habe, ist das arithmetische Mittel 0 und ich berechne wie weit die einzelnen Werte von der Achsen(je nach Merkmal) entfernt liegen im Quadrat. Daher hat der Punkt 4 eine größere Streuung als der Punkt 2.

Wenn ich jetzt richtig verstanden habe, dann ist orthogonale Richtung also genau die umgekehrte Richtung??

D.h. Wenn ich mich in winkelhalbierender Richtung bewege im Quadranten Nr1 (y=x), dann immer weiter ungefähr in einen 45grad Winkel schräg nach oben.
Wenn ich in die orthogonale Richtung gehe (y=-x) dann auch in einem 45grad Winkel, aber dieses Mal schräg nach unten (aus Sicht des ersten Quadranten)??

„Die Streuung der Punktewolke ist in Richtung der Winkelhalbierenden des
ersten Quadranten viel gröser als in der zu dieser orthogonalen Richtung.
Dies hat zur Konsequenz, dass der Punkt 2 hinsichtlich der euklidischen Distanz
näher am Punkt 1 liegt als der Punkt 4.“

Wenn ich jetzt bei der Distanzenberechnung die Varianzen einbeziehe, dann ist es klar , dass die Distanzen umso kleiner werden, je größer die Varianzen sind.
Dann heisst das, dass Punkt 2 fälschlicherweise näher an Punkt 1 ist? Oder wie soll ich das verstehen??
Ehos Auf diesen Beitrag antworten »

Habe die Sache ehrlichgesagt auch nicht vollständig verstanden. Ich vermute folgendes:

Die Frage, die beantwortet werden soll, ist, <Zitat am Ende von Seite 7> "ob die euklidischen Distanzen geeignet sind" zum Auswerten der Daten (gemeint sind die euklidischen Distanzen in Abbildung 1) . Diese Frage wird verneint mit dem Satz unterhalb Formel (4) <Zitat>: "Wir sehen, dass das Problem nicht gelöst wird." Das liegt meiner Meinung nach daran, dass man anstelle der euklidischen Distanzen besser die Distanzen der Punkte zur schrägen Geragen y=x auszuwerten sollte (also die Länge der Lote von den Punkten auf die schiefe Gerade y=x). Deshalb dreht man die Punktwolke um 45°, so dass Abbildung 2 entsteht.
student8 Auf diesen Beitrag antworten »

alles klar, ich versuche nochmal irgendeinen prof zu fragen, aber danke für die hilfe
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »