0

Ich habe ein Datensatz von NKnoten und KVerteilzentren. Wenn ich ihre entsprechenden (x, y) Koordinaten kennen Clustering mit N Knoten und K Verteilzentren

welcher Algorithmus kann ich diese Knoten hält das Gleichgewicht zwischen dem Abstand node-Zentrum und die Anzahl der Knoten mit den Zentren zugeordneten Cluster verwenden?

Zum Beispiel könnte ich als Kriterien verwenden, um die Knoten zu ihrem nächsten Zentrum der Verteilung zuweisen, aber diese Verteilzentren mit vielen Knoten produzieren könnte, und ich möchte, dies zu vermeiden. Irgendeine Hilfe?

+3

Könnte als ein MIP (Mixed Integer Programming Problem) geschrieben werden. So etwas wie ein Zuweisungsproblem, –

+2

Wie viel wichtiger ist es, dass die Knoten in der Nähe ihres "Warehouse" gut verteilt sind? Betrachten Sie ein konstruiertes Beispiel mit 2 Warehouses, und N-1-Knoten sind in der Nähe von Warehouse A und nur 1 in der Nähe von B. Wann verbinden wir Knoten mit B? –

+0

Du hast recht, Erwin, das war die erste Technik und hat sehr gut funktioniert, aber ich experimentiere mit schnelleren Methoden, um die beste Antwort zu opfern. Aus diesem Grund ist ein MIP für mich keine Option mehr. Danke für deinen Vorschlag – jonango

Antwort

1

Formuliere dies als ein Optimierungsproblem.

z. durchschnittliche Entfernung und ein Penalty-Faktor, wenn zu viele N demselben K zugewiesen sind.

Verwenden Sie dann eine Standardoptimierungstechnik, um eine Lösung zu finden.

Erwarten Sie nichts, was vage Einschränkungen wie die Ihre unterstützt. Sie müssen entscheiden, was eine gute Lösung ist, dann haben Sie eine Optimierer Suche eine gute Lösung.