Hierachische Clusteranalyse : Centroid Verfahren Distanzberechnung

Neue Frage »

auxiliumseeker Auf diesen Beitrag antworten »
Hierachische Clusteranalyse : Centroid Verfahren Distanzberechnung
Meine Frage:
Hallo zusammen,

Ich stehe gerade vor dem Problem, das ich ein Beispiel auf Wikipedia nicht ganz nachvollziehen kann:

http://de.wikipedia.org/wiki/Hierarchische_Clusteranalyse#Beispiel

Konkret geht es um das Beispiel für das Centroid Verfahren.
Dabei soll die Distanz von zwei Clustern anhand der Distanz der Clustermittelpunkte berechnet werden.

Jetzt ist folgendes gegeben:
In Cluster 1 befinden sich zwei Objekte o1 und o2, die zu einander einen Abstand von 4 haben.
Das neue Cluster was fusioniert werden soll, besteht nur aus einem Objekt o3. Foglich ist o3 ja der Mittelpunkt von diesem Cluster.
Zusätzlich ist bekannt, o3 hat zu o1 einen Abstand von 7 und o3 zu o1 einen Abstand von 5.

Der Centroidenabstand wird jetzt so berechnet:

http://upload.wikimedia.org/math/6/9/6/696468a638e40a8459e98d82268d00b9.png

Wieso ist das so?
Wie kann man überhaupt einen Centroiden berechnen, wenn nur die Distanzen bekannt sind?

Meine Ideen:
Centroid vom zweiten Cluster ist klar: o3.
Centroid vom ersten Cluster liegt zwischen o1 und o2.
Der müsste dann ja jeweils 2 von o1 und o2 (bei Distanz von 4 zwischen o1 und o2) entfernt sein.

Aber jetzt hängts bei mir.
Abakus Auf diesen Beitrag antworten »
RE: Hierachische Clusteranalyse : Centroid Verfahren Distanzberechnung
Hallo,

du meinst das Average Group Linkage? Zunächst geht es ja darum, eine Distanz zu haben und dann zu berechnen (verschiedene Probleme ergeben verschiedene sinnvolle Distanzdefinitionen). Ist die Distanz genügend klein, hat man ein Cluster gefunden; dann lässt sich das Zentrum berechnen. (so verstehe ich es)

Abakus smile
andrea2202 Auf diesen Beitrag antworten »
Hierarchische agglomeratives Clusterverfahren - Centroid Verfahren - Distanzberechnung
Hallo,

ich hätte eine Frage zur Centroid Clustering. Welchen Cluster fusioniere ich zuerst, wenn es zwei identische Abstände bzw. Distanzen gibt?

C1(1,3) C2(5,6,7) C3(10,10) C4(14,17)

Distanzen:
zwischen C1 und C2 = 4
und
zwischen C2 und C3 = 4

fusioniere ich dann alle drei Cluster also C1+C2+C3 als mit den Werten (1,3,5,6,7,10,10)?

oder nur C1 und C2

oder C2 und C3?

Danke für die Weiterhilfe!
10001000Nick1 Auf diesen Beitrag antworten »

Doppelpost: http://www.gute-mathe-fragen.de/66396/hi...stanzberechnung.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »