Hierachische Clusteranalyse : Centroid Verfahren Distanzberechnung |
24.11.2012, 10:27 | auxiliumseeker | Auf diesen Beitrag antworten » |
Hierachische Clusteranalyse : Centroid Verfahren Distanzberechnung Hallo zusammen, Ich stehe gerade vor dem Problem, das ich ein Beispiel auf Wikipedia nicht ganz nachvollziehen kann: http://de.wikipedia.org/wiki/Hierarchische_Clusteranalyse#Beispiel Konkret geht es um das Beispiel für das Centroid Verfahren. Dabei soll die Distanz von zwei Clustern anhand der Distanz der Clustermittelpunkte berechnet werden. Jetzt ist folgendes gegeben: In Cluster 1 befinden sich zwei Objekte o1 und o2, die zu einander einen Abstand von 4 haben. Das neue Cluster was fusioniert werden soll, besteht nur aus einem Objekt o3. Foglich ist o3 ja der Mittelpunkt von diesem Cluster. Zusätzlich ist bekannt, o3 hat zu o1 einen Abstand von 7 und o3 zu o1 einen Abstand von 5. Der Centroidenabstand wird jetzt so berechnet: http://upload.wikimedia.org/math/6/9/6/696468a638e40a8459e98d82268d00b9.png Wieso ist das so? Wie kann man überhaupt einen Centroiden berechnen, wenn nur die Distanzen bekannt sind? Meine Ideen: Centroid vom zweiten Cluster ist klar: o3. Centroid vom ersten Cluster liegt zwischen o1 und o2. Der müsste dann ja jeweils 2 von o1 und o2 (bei Distanz von 4 zwischen o1 und o2) entfernt sein. Aber jetzt hängts bei mir. |
||
25.11.2012, 11:37 | Abakus | Auf diesen Beitrag antworten » |
RE: Hierachische Clusteranalyse : Centroid Verfahren Distanzberechnung Hallo, du meinst das Average Group Linkage? Zunächst geht es ja darum, eine Distanz zu haben und dann zu berechnen (verschiedene Probleme ergeben verschiedene sinnvolle Distanzdefinitionen). Ist die Distanz genügend klein, hat man ein Cluster gefunden; dann lässt sich das Zentrum berechnen. (so verstehe ich es) Abakus |
||
21.11.2013, 19:33 | andrea2202 | Auf diesen Beitrag antworten » |
Hierarchische agglomeratives Clusterverfahren - Centroid Verfahren - Distanzberechnung Hallo, ich hätte eine Frage zur Centroid Clustering. Welchen Cluster fusioniere ich zuerst, wenn es zwei identische Abstände bzw. Distanzen gibt? C1(1,3) C2(5,6,7) C3(10,10) C4(14,17) Distanzen: zwischen C1 und C2 = 4 und zwischen C2 und C3 = 4 fusioniere ich dann alle drei Cluster also C1+C2+C3 als mit den Werten (1,3,5,6,7,10,10)? oder nur C1 und C2 oder C2 und C3? Danke für die Weiterhilfe! |
||
21.11.2013, 20:04 | 10001000Nick1 | Auf diesen Beitrag antworten » |
Doppelpost: http://www.gute-mathe-fragen.de/66396/hi...stanzberechnung. |
|
Verwandte Themen
Die Beliebtesten » |
|
Die Größten » |
|
Die Neuesten » |
|