Ich habe große Datenmenge, die aus etwa 94 Spalten und 3 Millionen Zeilen bestehen. Diese Datei hat sowohl einzelne als auch mehrere Leerzeichen als Trennzeichen zwischen den Spalten. Ich brauche Dazu einige Spalten aus dieser Datei in R. lesen I read.table versucht, mit() mit den Optionen, die in dem unten stehenden Code zu sehen sind, wird der Code unten-Textdatei mit mehreren Leerzeichen als Trennzeichen in R
eingefügt### Defining the columns to be read from the file, the first 5 column, then we do not read next 24, after this we read next 5 columns. Last 60 columns are not read in-
col_classes = c(rep("character",2), rep("numeric", 3), rep("NULL",24), rep("numeric", 5), rep("NULL", 60))
### Reading first 100 rows of the data
data <- read.table(file, sep = " ",header = F, nrows = 100, na.strings ="", stringsAsFactors= F)
Da die Datei das einlesen muss haben mehr als ein Leerzeichen als das Trennzeichen zwischen einigen der Spalte, die obige Methode funktioniert nicht. Gibt es eine Methode, mit der wir diese Datei effizient lesen können?
Entfernen Sie einfach das 'sep =" "' Argument. 'read.table' kann standardmäßig mehrere Leerzeichen behandeln. –
Ich habe ein sehr ähnliches Problem, aber ich brauche eine allgemeinere Lösung, da ich in einigen Feldern einzelne Leerzeichen habe. Das bedeutet, dass ich in der Lage sein sollte, die Mindestanzahl von aufeinanderfolgenden Leerzeichen (in meinem Fall 2) als Trennzeichen zu definieren, ohne Begrenzung dafür. – EdM
Related Post: https://StackOverflow.com/Questions/30955464/Reading-Ausgerichtete-column-Data-mit-Fread – zx8754