Die k-Medoide in der clara() Funktion verwendet Abstand Cluster zu bilden, so dass ich dieses Muster erhalten:Wie Cluster nach Trend statt nach Entfernung in R?
a <- matrix(c(0,1,3,2,0,.32,1,.5,0,.35,1.2,.4,.5,.3,.2,.1,.5,.2,0,-.1), byrow=T, nrow=5)
cl <- clara(a,2)
matplot(t(a),type="b", pch=20, col=cl$clustering)
Aber ich möchte eine Clustering-Methode zu finden, die jeder Zeile einen Cluster zuordnet Entsprechend seinem Trend gehören die Linien 1, 2 und 3 zu einem Cluster und die Linien 4 und 5 zu einem anderen.
Ist das anders aus, was @joran vorgeschlagen hat? Ich könnte den Unterschied nicht sehen – nachocab
Nachdem ich gerade seine Antwort gelesen habe: Nein, es ist nicht wesentlich anders. Ich schlage eine andere Skalierung vor. jedoch der entscheidende Punkt, den ich wollte darauf hinweisen, dass dies auf den wichtigen Schritt der Vorverarbeitung gehört, dass man nicht vernachlässigen darf. Deshalb wird immer so viel über den KDD-Prozess geredet: https://en.wikipedia.org/wiki/Data_mining#Process Es sind 90% der Anstrengungen im realen Bergbau, es sind höchstens 5% der wissenschaftlichen Ergebnisse, die Fokus auf neue Algorithmen. –