2016-09-07 1 views
1

I haben momentan 2 Cluster, die im wesentlichen entlang der Linien 2 auf einer 3D-Oberfläche liegen:K-Means-Cluster für diagonale

Plot of the two clusters

I einen einfachen KMeans Algorithmus versucht haben, die die obige Trennung ergab. (Große rote Punkte sind die Mittel)

Ich habe Clustering mit weichen K-Mittel mit verschiedenen Varianzen für jeden Mittelwert entlang der 3 Dimensionen versucht. Es hat jedoch auch versäumt, dies zu modellieren, vermutlich weil es nicht in die Form einer diagonalen Gaußschen Form passen kann.

Gibt es einen anderen Algorithmus, der berücksichtigen kann, dass die Daten diagonal sind? Alternativ gibt es eine Möglichkeit, die Daten im Wesentlichen "rotieren" zu lassen, so dass weiche k-Mittel zum Funktionieren gebracht werden können.

+1

k-means ist nur ein Spezialfall, um ein Gauss'sches Mischmodell zu lernen. Allgemeine Gauß'sche Mischungsmodelle erfassen ebenfalls die Rotation. – cel

+0

Wenn ich raten musste, ist es wahrscheinlicher, dass die Ausreißer das Clustering nach rechts beeinflussen. Versuchen Sie, diese Ausreißer zu entfernen, und versuchen Sie erneut, Clustering durchzuführen. – nemo

Antwort

0

K-Mittel ist nicht gut für Korrelationen vorbereitet.

Aber diese Cluster sehen vernünftig Gaussian zu mir, sollten Sie versuchen Gaussian Mixture Modeling stattdessen.

Verwandte Themen