2016-03-22 11 views

Antwort

1

Redigiert meine Antwort, wie ich Ihre Frage miss-las.

Wie ich laufen verstehen, ist die Anzahl der Male KMeans wiederholt wird, um die optimale Cluster und MaxIterations zu bekommen bedeutet die Anzahl der Iteration in jedem Lauf ist es richtig

Ja, das ist richtig. Normalerweise laufen Sie nur einmal k-means. Die maximale Iteration ist die maximale Anzahl der Iterationen, die Sie für die k-means Centroid-Update-Schleife zulassen.

Sparks Implementierung unterstützt, was mit läuft, dh. Wie oft möchten Sie ausführen den Algorithmus. Es ist normalerweise nicht notwendig. Vor allem, da die Optimierung der k-Means-Metrik nicht unbedingt das optimiert, was Ihr eigentliches Ziel ist.

Was sind die besten Werte für sie im Fall von 5000 Datenpunkten?

Sie sollten solche Fragen nicht stellen, diese Dinge sind immer problem- und datenabhängig. Sie sollten daran arbeiten, die von Ihnen verwendeten Tools besser zu verstehen und zu verstehen, was sie bedeuten und wie Sie mit ihnen iterieren können. Dadurch vermeiden Sie, sich in eine Situation zu begeben, in der Sie diese Art von Frage stellen möchten, oder wenn es gerechtfertigt ist - welcher andere Kontext benötigt wird (nur die Anzahl der Bezugspunkte ist sicherlich nicht genug Kontext für eine sinnvolle Diskussion).

Verwandte Themen