Gibt es sowieso, um den folgenden Prozess in R zu beschleunigen?Schnellere Möglichkeit, mehrere CSV zu einem Datenrahmen zu lesen?
theFiles <- list.files(path="./lca_rs75_summary_logs", full.names=TRUE, pattern="*.summarylog")
listOfDataFrames <- NULL
masterDataFrame <- NULL
for (i in 1:length(theFiles)) {
tempDataFrame <- read.csv(theFiles[i], sep="\t", header=TRUE)
#Dropping some unnecessary row
toBeRemoved <- which(tempDataFrame$Name == "")
tempDataFrame <- tempDataFrame[-toBeRemoved,]
#Now stack the data frame on the master data frame
masterDataFrame <- rbind(masterDataFrame, tempDataFrame)
}
Grundsätzlich lese ich mehrere csv-Dateien in einem Verzeichnis. Ich möchte alle CSV-Dateien zu einem riesigen Datenrahmen durch Stapeln der Zeilen kombinieren. Die Schleife scheint länger zu laufen, wenn der masterDataFrame größer wird. Ich mache das auf einem Linux-Cluster.
Vielen Dank. rbindlist beschleunigt die Dinge wirklich! – WonderSteve
Verwenden Sie 'fread' anstelle von' read.csv', wenn Sie den data.table-Pfad durchgehen .... – mnel