Wie ich verstehe der run
Parameter ist die Anzahl der Male KMeans wiederholt wird, um die optimale Cluster und maxIterations
ist die Anzahl der Iteration in jedem run
, ist es richtig? Was sind die besten Werte für sie im Fall von 5000 Datenpunkten?Der Unterschied zwischen MaxIterations und in MLlib KMeans ausgeführt?
Antwort
Redigiert meine Antwort, wie ich Ihre Frage miss-las.
Wie ich laufen verstehen, ist die Anzahl der Male KMeans wiederholt wird, um die optimale Cluster und MaxIterations zu bekommen bedeutet die Anzahl der Iteration in jedem Lauf ist es richtig
Ja, das ist richtig. Normalerweise laufen Sie nur einmal k-means. Die maximale Iteration ist die maximale Anzahl der Iterationen, die Sie für die k-means Centroid-Update-Schleife zulassen.
Sparks Implementierung unterstützt, was mit läuft, dh. Wie oft möchten Sie ausführen den Algorithmus. Es ist normalerweise nicht notwendig. Vor allem, da die Optimierung der k-Means-Metrik nicht unbedingt das optimiert, was Ihr eigentliches Ziel ist.
Was sind die besten Werte für sie im Fall von 5000 Datenpunkten?
Sie sollten solche Fragen nicht stellen, diese Dinge sind immer problem- und datenabhängig. Sie sollten daran arbeiten, die von Ihnen verwendeten Tools besser zu verstehen und zu verstehen, was sie bedeuten und wie Sie mit ihnen iterieren können. Dadurch vermeiden Sie, sich in eine Situation zu begeben, in der Sie diese Art von Frage stellen möchten, oder wenn es gerechtfertigt ist - welcher andere Kontext benötigt wird (nur die Anzahl der Bezugspunkte ist sicherlich nicht genug Kontext für eine sinnvolle Diskussion).
- 1. Cluster-Labels in mllib erhalten kmeans pyspark
- 2. Dimension Konfliktfehler mit Zünd-/MLLib Kmeans
- 3. OutOfMemory bei der Ausführung Spark MLlib kmeans
- 4. Was ist der Unterschied zwischen Kmeans und Kmeans2 in Scipy?
- 5. Was ist der Unterschied zwischen Spark ML und MLLIB Pakete
- 6. Warum ist Spark MLLib KMeans Algorithmus extrem langsam?
- 7. Predict Cluster von Daten unter Verwendung von Funken MLlib KMeans
- 8. einen Datenrahmen aus einer CSV zu MLlib Kmeans erstellt Fütterung: Indexerror: Listenindex außerhalb des zulässigen Bereichs
- 9. Unterschied zwischen org.apache.spark.ml.classification und org.apache.spark.mllib.classification
- 10. Unterschied zwischen `% in%` und `==`
- 11. Unterschied zwischen $ {} und $() in Bash
- 12. Streaming Kmeans Spark JAVA
- 13. Der Unterschied zwischen ":" und =“in Winkel 2
- 14. Was ist der Unterschied zwischen HashingTF und CountVectorizer in Spark?
- 15. Was ist der Unterschied zwischen Verilog! und ~?
- 16. Unterschied zwischen "" und "" in Python
- 17. Unterschied zwischen $ @ und $! in Perl
- 18. Unterschied zwischen '.' und "." in Java
- 19. Unterschied zwischen .. und ... in Ruby
- 20. Unterschied zwischen // und /// in C#
- 21. Unterschied zwischen Cron und Crontab?
- 22. Unterschied zwischen getmypid() und posix_getpid()
- 23. Unterschied zwischen RTC und RTC_WAKEUP in Android
- 24. Was ist der Unterschied zwischen <= und: = in VHDL
- 25. Was ist der Unterschied zwischen substring() und substr() in MySQL?
- 26. Unterschied zwischen und „-“ in r
- 27. Der Unterschied zwischen "=" und "IN"/"NICHT IN" und "MINUS"
- 28. Unterschied zwischen. und #
- 29. Unterschied zwischen * y ++ und ++ * y?
- 30. Unterschied zwischen dynamic und System.Object