2017-01-12 1 views
0

Dies ist das Ergebnis der Cluster-Analyse durch die k-Means-Funktion.Wie rangiere ich das Merkmal von Cluster in r

>weseg2<-read.csv("WE_SEG DATA.csv",header=TRUE) 

>training.data2<-scale(weseg2) 

>aaaa<-kmeans(training.data2, centers=4, iter.max=10000, nstart=20) 

Ich möchte wissen, welche Eigenschaften jeder Cluster hat. So bekam ich den Durchschnitt jeder Variablen nach Clustern. Dies ist mein Code, der den Mittelwert von Variablen berechnet.

Mittel der ersten Cluster

>rank1<-colMeans(training.data2[aaaa$cluster==1,]) 

Mittel der zweiten Cluster

>rank2<-colMeans(training.data2[aaaa$cluster==2,]) 

Mittel der dritten Cluster

>rank3<-colMeans(training.data2[aaaa$cluster==3,]) 

Mittelwert der vierten Cluster

>rank4<-colMeans(training.data2[aaaa$cluster==4,]) 

Wenn ja, welcher Code sollte eingegeben werden, damit die Cluster für jede Variable geordnet werden können? Wenn Sie zum Beispiel die Variablen a, b und c haben, haben Sie einen Rang von vier Clustern in der Variablen a und einen Rang von vier Clustern in den Variablen b und c.

Antwort

1

Verwenden Sie die Funktion apply und rank. wie diese

>rank5<-cbind(rank1,rank2,rank3,rank4) 
>apply(rank5,1,rank) 

Dann können Sie einen Rang von Spalten erhalten. Und wenn Sie Rang als Rückgang erhalten möchten, verwenden Sie die Funktion order().

viel Glück.

Verwandte Themen