Drei alternative Lösungen:
1: Mit reshape2
library(reshape2)
long <- melt(wide, id.vars = c("Code", "Country"))
geben:
Code Country variable value
1 AFG Afghanistan 1950 20,249
2 ALB Albania 1950 8,097
3 AFG Afghanistan 1951 21,352
4 ALB Albania 1951 8,986
5 AFG Afghanistan 1952 22,532
6 ALB Albania 1952 10,058
7 AFG Afghanistan 1953 23,557
8 ALB Albania 1953 11,123
9 AFG Afghanistan 1954 24,555
10 ALB Albania 1954 12,246
Einige alternative Schreibweisen, die das gleiche Ergebnis:
# you can also define the id-variables by column number
melt(wide, id.vars = 1:2)
# as an alternative you can also specify the measure-variables
# all other variables will then be used as id-variables
melt(wide, measure.vars = 3:7)
melt(wide, measure.vars = as.character(1950:1954))
2: Mit data.table
können Sie verwenden die gleiche melt
Funktion wie in der reshape2
Paket (das ist eine erweiterte & verbesserte Implementierung). melt
von data.table
hat auch mehr Parameter, die melt
von reshape2
.Sie können für exaple angeben, kann auch den Namen der Variablen-Spalte:
library(data.table)
long <- melt(setDT(wide), id.vars=c("Code","Country"), variable.name="year")
Einige alternativen Schreibweisen:
melt(setDT(wide), id.vars = 1:2, variable.name = "year")
melt(setDT(wide), measure.vars = 3:7, variable.name = "year")
melt(setDT(wide), measure.vars = as.character(1950:1954), variable.name = "year")
3: Mit tidyr
library(tidyr)
long <- wide %>% gather(year, value, -c(Code, Country))
einigen alternativen Schreibweisen:
wide %>% gather(year, value, -Code, -Country)
wide %>% gather(year, value, -1:-2)
wide %>% gather(year, value, -(1:2))
wide %>% gather(year, value, -1, -2)
wide %>% gather(year, value, 3:7)
wide %>% gather(year, value, `1950`:`1954`)
Wenn Sie NA
Werte ausschließen möchten, können Sie na.rm = TRUE
zum melt
sowie die gather
Funktionen hinzuzufügen.
Ein weiteres Problem bei den Daten ist, dass die Werte von R als Zeichen-Werte gelesen werden (als Ergebnis der ,
in den Zahlen). Sie können das reparieren mit gsub
und as.numeric
:
long$value <- as.numeric(gsub(",", "", long$value))
Oder direkt mit data.table
oder dplyr
:
# data.table
long <- melt(setDT(wide),
id.vars = c("Code","Country"),
variable.name = "year")[, value := as.numeric(gsub(",", "", value))]
# tidyr and dplyr
long <- wide %>% gather(year, value, -c(Code,Country)) %>%
mutate(value = as.numeric(gsub(",", "", value)))
Daten:
wide <- read.table(text="Code Country 1950 1951 1952 1953 1954
AFG Afghanistan 20,249 21,352 22,532 23,557 24,555
ALB Albania 8,097 8,986 10,058 11,123 12,246", header=TRUE, check.names=FALSE)
Sie wissen nicht, ob das das Problem war, aber die Funktionen in dem reshape Paket sind Schmelze und Guss –
Und das reshape Paket durch abgelöst wurde umformen2. –
Und jetzt wurde reshape2 von tidyr abgelöst. – drhagen