Clustering-Techniken für die Ähnlichkeitsmatrix

Ich habe eine binäre Daten von 128 Antwortenden basierend auf den Funktionen der Digitalkamera, die sie ausgewählt haben. Dabei steht "1" für die Auswahl des Merkmals und "0" für das nicht ausgewählte Merkmal. Ich habe 92 Produktmerkmale in den Spalten und in den Antwortern in den Reihen. Jeder Antwortende hat genau 20 Merkmale aus einem Satz von 92 Merkmalen ausgewählt. Ich möchte die Cluster verschiedener Benutzergruppen basierend auf den ausgewählten Funktionen erstellen. Ich habe einige Clustering-Algorithmen wie Fuzzy-Clustering und hierarchical auf diesen binaray Daten versucht, aber es gab mir keine guten Ergebnisse und die Cluster erstellt wurden wirklich schlecht. Also habe ich nun die Würfelkoeffizientenähnlichkeitsmatrix auf die Daten der Antwortenden angewandt, was im Grunde den Ähnlichkeitswert für jeden Antwortenden mit allen anderen Antwortenden ergibt. Ist es möglich, Clustering-Technik auf diese Ähnlichkeitsmatrix anzuwenden, um gute Cluster zu erhalten? Auch, welche Clustering-Techniken zur Verfügung stehen, die ich auf diese Benutzerähnlichkeitsmatrix anwenden könnte, so dass ich die Cluster von Benutzern basierend auf ihrem similarity Score identifizieren könnte. Jeder Vorschlag und Kommentar würde wirklich geschätzt werdenClustering-Techniken für die Ähnlichkeitsmatrix

Quelle

2017-03-07 sidra

Da Ihr Datensatz winzig ist, gehen Sie mit hierarchischen Clustering.

Es kann mit Abstand oder mit Ähnlichkeit implementiert werden.

Quelle

2017-03-08 21:17:21

Clustering-Techniken für die Ähnlichkeitsmatrix

Antwort

Verwandte Themen