2016-06-03 10 views
0

Ich versuche, Cluster um Medoids mit PAM-Algorithmus in R zu bilden. Gibt es sowieso die Clustergröße für PAM (etwas Bruteforce die Clustergröße) zu beheben? Gibt es andere Clustering-Algorithmen, die Cluster mit gleicher Größe für Medoide bereitstellen?Clustering-Algorithmus zum Erhalten von gleichgroßen Clustern

Vielen Dank im Voraus für Ihre Hilfe.

+0

Duplizieren zu: http://stats.stackexchange.com/questions/8744/clustering-procedure-where-each-cluster-has-an-equal-number-of-points –

+0

Spezialfall des Duplikats: [Optimale Gruppierung/Clustering von Elementen in Gruppen mit minimaler Größe] (http://stackoverflow.com/questions/37589168/optimal-grouping-clustering-of-items-in-groups-with-minimum-size) –

+0

Hallo @Lawrence hast du bekommen irgendeine Antwort auf dieses Problem? Ich suche eine R-Implementierung eines solchen Algorithmus, konnte aber keine finden. danke – agenis

Antwort

2

Sie können einen Clustering-Algorithmus ändern, um Ihren Bedürfnissen zu entsprechen.

Sie können diesem Tutorial for Same-Size K-Means folgen, oder verwenden Sie einfach diesen Algorithmus aus dem tutorial Paket/Modul in ELKI (bauen Sie die neueste Version von GitHub, weil ich gerade einen Fehler dort behoben - dies wird in ELKI 0.7.2 enthalten sein).

Im Wesentlichen führt dieser Algorithmus eine k-means-Methode der kleinsten Quadrate durch, aber alle Cluster müssen die gleiche Größe haben (wenn N/k nicht ganzzahlig ist, können die Clustergrößen um 1 variieren).

Wenn Sie nach oben Tutorial gehen und nach unten scrollen, können Sie Beispielergebnisse sehen.

+0

Vielen Dank für Ihre Antwort. Leider arbeite ich mit einer Unähnlichkeitsmatrix (ich habe keine Koordinaten um kmeans benutzen zu können). Meine Daten sind in den Formobjekten und ein Gewicht ist Attribute zu jedem Paar. Deshalb benutze ich PAM. Ich habe jedoch meinen eigenen Cluster-Algorithmus entwickelt, der meinem Problem entspricht. Wird es veröffentlichen, wenn ich mit dem Codieren fertig bin. Danke noch einmal ! – Lawrence

+0

Sie können dem Lernprogramm im Wesentlichen folgen, aber mit KMedoidsEM anstelle von KMeans arbeiten. Es ist ähnlich wie k-means, verwendet aber das Medoid wie PAM. Mit den obigen Modifikationen erhalten Sie eine K-Medoids, die gewährleistet, dass Cluster die gleiche Größe haben. –

Verwandte Themen