Ich habe eine binäre Daten von 128 Antwortenden basierend auf den Funktionen der Digitalkamera, die sie ausgewählt haben. Dabei steht "1" für die Auswahl des Merkmals und "0" für das nicht ausgewählte Merkmal. Ich habe 92 Produktmerkmale in den Spalten und in den Antwortern in den Reihen. Jeder Antwortende hat genau 20 Merkmale aus einem Satz von 92 Merkmalen ausgewählt. Ich möchte die Cluster verschiedener Benutzergruppen basierend auf den ausgewählten Funktionen erstellen. Ich habe einige Clustering-Algorithmen wie Fuzzy-Clustering und hierarchical auf diesen binaray Daten versucht, aber es gab mir keine guten Ergebnisse und die Cluster erstellt wurden wirklich schlecht. Also habe ich nun die Würfelkoeffizientenähnlichkeitsmatrix auf die Daten der Antwortenden angewandt, was im Grunde den Ähnlichkeitswert für jeden Antwortenden mit allen anderen Antwortenden ergibt. Ist es möglich, Clustering-Technik auf diese Ähnlichkeitsmatrix anzuwenden, um gute Cluster zu erhalten? Auch, welche Clustering-Techniken zur Verfügung stehen, die ich auf diese Benutzerähnlichkeitsmatrix anwenden könnte, so dass ich die Cluster von Benutzern basierend auf ihrem similarity Score identifizieren könnte. Jeder Vorschlag und Kommentar würde wirklich geschätzt werdenClustering-Techniken für die Ähnlichkeitsmatrix
0
A
Antwort
0
Da Ihr Datensatz winzig ist, gehen Sie mit hierarchischen Clustering.
Es kann mit Abstand oder mit Ähnlichkeit implementiert werden.
Verwandte Themen
- 1. Cluster Cosinus-Ähnlichkeitsmatrix
- 2. Effektives Clustering einer Ähnlichkeitsmatrix
- 3. wie Ähnlichkeitsmatrix in numpy Python erstellen?
- 4. XQuery, wie man eine Ähnlichkeitsmatrix bildet?
- 5. Wie zu importieren Ähnlichkeitsmatrix in Gephi
- 6. Was sollte die Eingabe der Verknüpfungsfunktion in scipy sein?
- 7. Ist die Reichweite für die Schleife vorteilhaft für die Leistung?
- 8. Ideen für die Implementierung mehrerer Ansichten für die gleichen Daten
- 9. Generisches Design für die Verpackung von Benutzeränderungen für die Bereitstellung
- 10. die Anwendung Vorrang für die Infix Form für mehrere Ausdrücke
- 11. log4j2: Speicherort für die Log4jContextSelector-Systemeigenschaft für die asynchrone Protokollierung
- 12. CDN für die Produktion, lokale Dateien für die Entwicklung
- 13. Die MySQL-Struktur für einen Zeitbereich für die Abfrageoptimierung korrigieren?
- 14. Best Practices für die Kryptographie für die Passwortspeicherung in Node
- 15. Formel für Excel, die das Projekt für die Dauer verwendet
- 16. setInterval für die Zufallsfunktion
- 17. Die Standardeinstellung für KeyValuePair
- 18. Videos für die Webseite
- 19. Präfix für die Schienengeneratoren
- 20. PCA für die Bildverarbeitung
- 21. Transaktion für die Sammlung
- 22. Rückgabewert für Funktion, die
- 23. Pixelflussbibliothek für die Verarbeitung
- 24. Regex für die Website
- 25. Datentyp für die Zeitzonenvariable
- 26. % Operator für die Zeitberechnung
- 27. Zahlenbildung für die Bytekonvertierung
- 28. Buchleser für die Webseite
- 29. Für die endgültige Schleifenausgang
- 30. Protokoll für die Klassenmethode