2017-09-13 3 views

Antwort

1

Der Standard k-means ist ein Hard Clustering Algorithmus, d. H. Es gibt keinen Grad der Anpassung; Datenpunkte gehören zu einem einzigen Cluster. Hier ist ein Zitat aus einem relevanten academic paper (Hervorhebung hinzugefügt):

2.3.1. Fest k-means

[...]

im k-Mitteln nur Grad bivalente Mitgliedschaft Objekt clustering i zu Cluster k sind erlaubt: λ [i, k] ∈ { 0,1}. Wenn ein Objekt i ein Mitglied einer Cluster ist es kann kein Mitglied eines anderen Clusters sein

K-means++ ist nur ein Algorithmus für die Anfangswerte der Auswahl (Saatgut) für die k-means, und ändert den fundamentalen Charakter von K-Means nicht als Hard-Clustering-Algorithmus.

0

Es gibt "weiche" Varianten von k-bedeutet, dass dies zulassen.

Insbesondere Fuzzy-c-Mittel (fragen Sie mich nicht, warum sie c statt k verwenden ...)

Aber Vorsicht, dass die resultierende weiche Zuordnung weit von einer statistischen Wahrscheinlichkeit ist. Es ist nur eine Zahl, die ein relatives Gewicht basierend auf der Quadratdistanz, ohne irgendein starkes statistisches Modell gibt.

Verwandte Themen