Ich habe einen Datenrahmen, der df ist.Ich bin nicht in der Lage, Zusammenfassung für eine der Spalten in r
id time internet lat lng
103 1 1385913600 14.057844 1 0
247 2 1385913600 14.062213 2 0
391 3 1385913600 14.066863 3 0
535 4 1385913600 14.045190 4 0
679 5 1385913600 12.772210 5 0
823 10 1385913600 8.101804 10 0
Ich habe eine neue Spalte und stellen Werte aller von ihnen 0 durch eine der folgenden Methoden verwenden:
df["cluster"] <- 0
df$cluster <- 0
Und dann von meinem Algorithmus ich Wert jedes df $ Cluster verändert die Sie können die Methode sehen ich verwenden Wert von df $ Cluster zu ändern: ich das Ergebnis, das ich bin auf der Suche bekam
clusternumber <- clusternumber + 1
df$cluster[df$id == minid] <- clusternumber
Am Ende, aber ich habe mit einem neuen Problem konfrontiert. Wenn ich versuche, eine Zusammenfassung meines Ergebnisses zu erhalten, bekomme ich seltsame Ergebnisse.
> summary(df)
id internet lat lng cluster
Min. : 1 Min. : 0.00 Min. : 1.00 Min. : 0.00 1 : 121
1st Qu.: 2500 1st Qu.: 15.57 1st Qu.: 25.25 1st Qu.: 25.00 2 : 121
Median : 5000 Median : 36.09 Median : 51.00 Median : 49.50 3 : 121
Mean : 5000 Mean : 75.73 Mean : 50.50 Mean : 49.51 4 : 121
3rd Qu.: 7501 3rd Qu.: 78.88 3rd Qu.: 75.75 3rd Qu.: 75.00 9 : 121
Max. :10000 Max. :6663.23 Max. :100.00 Max. :100.00 15 : 121
(Other):9272
Ich bin auf der Suche wissen, wie muss ich eine neue Spalte oder Änderungswert einer Spalte machen, weil jetzt das ich erhalte:
> summary(df$cluster)
1 2 3 4 9 15 16 17 34 52 85 147 8 6 7 36
121 121 other(2727)
Es scheint, als wäre Ihre 'cluster' Spalte' factor', daher gibt 'summary' die Nummer jedes Levels an. – www
@ycw genau manchmal habe ich einen Fehler und es zeigte mir, dass Cluster-Spalte Faktor ist, aber es ist kein Faktor! – asikhalaban