ich eine CSV-Datei, die eine Situation wie diese (zusätzliche Räume hinzugefügt, um die Lesbarkeit) enthält:R read.table Komma innerhalb entkam Anführungszeichen innerhalb Zeichenfolge
1, 3 , "string" , "string4" , NA
2, 5 , "string" , "s\"tring\"4" , 3
1, 3 , "string" , "stri,ng4" , 5
8, 7 , "string" , "st\"ri,n\"g4" , 5
ich auf einem Windows diese in RStudio lese 10 Maschine, mit der folgenden Anweisung:
read.table("file_name.csv",fill=TRUE, header=FALSE, quote="\"", sep=",", encoding="UTF-8")
mit der folgenden Reaktion:
V1 V2 V3 V4 V5 V6
1 1 3 string string4 <NA> NA
2 2 5 string s\\tring\\4 3 NA
3 1 3 string stri,ng4 5 NA
4 8 7 string st\\ri n\\g4 5
Das Problem scheint zu sein, dass das Komma innerhalb der maskierten Anführungszeichen in Zeile 5 als Trennzeichen interpretiert wird.
Ich erwarte/suche etwas wie folgt, aber ich bin mir nicht sicher, wie ich es bekommen soll.
V1 V2 V3 V4 V5
1 1 3 string string4 <NA>
2 2 5 string s\"tring\"4 3
3 1 3 string stri,ng4 5
4 8 7 string st\"ri,n\"g4 5
ich die Datei grep ‚zu ändern, mit der Aufbereitung unter Berücksichtigung \“, aber ich bin neugierig, ob es eine direkte Methode ist. Es scheint wie ein potenziell weit verbreitetes Problem, aber ich eine guten nicht finden kann, . Beispiel eine Lösung
Gedanken, jemand
gefunden diesen thread:?.. [link] (http://stackoverflow.com/questions/32103639/read-csv-file-in-r-with-double-quotes) Der Vorschlag für 'fread' aus' data.library' hat den Zweck erfüllt. –
Cool! Aus Gründen der Information stammt fread aus data.table, nicht aus data.library –