Welchen Vorverarbeitungsfilter ich in weka verwenden sollte, um k anzuwenden, bedeutet, dass ich für die Datensätze mit Attributen arbeite, die nicht quantitativ, sondern kategorisch sind. Zum Beispiel drei Datensätze mit nicht quantitativen Attributen des Einkommensniveaus mit Werten von {niedrig, mittel, hoch}, verheiratet mit Werten von {ja, nein} und Aufenthaltsstatus mit Werten von {Alabama, Alaska, ..., Wyoming}.Welcher Filter in weka zur Verwendung von k bedeutet Clustering auf kategorischen Daten?
0
A
Antwort
0
Viele Leute verwenden eine heiße Codierung für diese.
Die Ergebnisse sind in der Regel eher schlecht, weil k-means für kontinuierliche Variablen ausgelegt ist. Die resultierenden Cluster-Zentren sind nicht länger binär und können nicht gut auf kategoriale Werte abgebildet werden (was keine Überraschung ist, da k-means alles über bedeutet, aber was ist der Mittelwert von "Apfel", "Banane" und "Orange")?
Normalerweise erhalten Sie viel aussagekräftigere Ergebnisse, wenn Sie stattdessen nach häufigen itemsets anstelle von k-means Zentren suchen.
Verwandte Themen
- 1. K bedeutet Clustering weka Python mit
- 2. Matlab: K-bedeutet Clustering
- 3. K bedeutet Clustering in Matlab
- 4. Python k-bedeutet Clustering-Text
- 5. Scikit K-bedeutet Clustering Leistungsmessung
- 6. Python K bedeutet Clustering Array
- 7. Zugriff auf einzelne Werte von k bedeutet Clustering in r
- 8. K bedeutet Clustering in Scikit lernen
- 9. ggplot R Plot nach k bedeutet Clustering
- 10. k-bedeutet Clustering in R auf sehr große, spärliche Matrix?
- 11. K-bedeutet Clustering mit Inversion Entfernung
- 12. K-bedeutet Clustering mit vordefiniertem Dataset
- 13. Wie findet man k in k-bedeutet, wenn es eine Mischung aus kategorischen und numerischen Daten gibt?
- 14. K-bedeutet Clustering auf 3 Dimensionen mit sklearn
- 15. Clustering mit K-Means
- 16. K-bedeutet Clustering in R: Normalisierung DTM erstellt 'NaN'
- 17. RuntimeError: maximale Rekursionstiefe in cmp überschritten: K bedeutet Clustering
- 18. WEKA hierarchische Clustering-Ausgabe - Blattidentifikation Ambiguität
- 19. PCA vor K-Mittelwert-Clustering
- 20. Dateneingabe für K bedeutet Clustering mit Scipy, Python?
- 21. Online k-means Clustering
- 22. Verwenden von Spark MLLib-Clustering (K-Means) zur Erkennung von Netzwerkanomalien
- 23. Unterschied zwischen Content Based Recommender und K bedeutet Clustering
- 24. Gewichte von Funktionen in k-bedeutet
- 25. Jaccard in k-means Clustering
- 26. Clustering von ein- oder mehrdimensionalen Daten mit K-Means?
- 27. Spark k-bedeutet OutOfMemoryError
- 28. Hierarchisches Clustering für kategoriale Daten in Python
- 29. Clustering strukturelle 3D-Daten
- 30. KNN-Klassifizierung mit kategorischen Daten