Ich habe einen Datenrahmen, der wie folgt aussieht:Gruppe durch und Umfang/normalisieren eine Spalte in r
Store Temperature Unemployment Sum_Sales
1 1 42.31 8.106 1643691
2 1 38.51 8.106 1641957
3 1 39.93 8.106 1611968
4 1 46.63 8.106 1409728
5 1 46.50 8.106 1554807
6 1 57.79 8.106 1439542
Was ich nicht in R herausfinden kann, ist, wie Gruppe durch und anzuwenden. Daher möchte ich für jeden Speicher (gruppiert) zwei Spalten (sum_sales und temperature) normalisieren/skalieren.
Wunsch Ausgabe, die ich will, ist folgende:
Store Temperature Unemployment Sum_Sales
1 1 1.000 8.106 1.00000
2 1 0.000 8.106 0.94533
3 1 0.374 8.106 0.00000
4 2 0.012 8.106 0.00000
5 2 0.000 8.106 1.00000
6 2 1.000 8.106 0.20550
Hier ist die Normierungsfunktion, die ich erstellt:
normalit<-function(m){
(m - min(m))/(max(m)-min(m))
}
ich das DPLY Paket bin mit und kann nicht scheinen zu Figur heraus, wie man nach Gruppen sortiert und diese Funktion auf eine Spalte anwendet. Ich habe so etwas versucht und bekomme einen Fehler:
df2 <- df %.%
group_by('Store') %.%
summarise(Temperature = normalit(Temperature), Sum_Sales = normalit(Sum_Sales)))
Alle Vorschläge/Hilfe würde sehr geschätzt werden. Vielen Dank.
Sie haben eine Spalte "Arbeitslosigkeit" in Ihrem Ergebnis. Ist das für jedes Geschäft gleich> – jlhoward
ja .. Entschuldigung für die keine Angabe – itjcms18