2017-05-18 3 views
0

ich eine CSV-Datei, die eine Situation wie diese (zusätzliche Räume hinzugefügt, um die Lesbarkeit) enthält:R read.table Komma innerhalb entkam Anführungszeichen innerhalb Zeichenfolge

1, 3 , "string" , "string4"  , NA 
2, 5 , "string" , "s\"tring\"4" , 3 
1, 3 , "string" , "stri,ng4"  , 5 
8, 7 , "string" , "st\"ri,n\"g4" , 5 

ich auf einem Windows diese in RStudio lese 10 Maschine, mit der folgenden Anweisung:

read.table("file_name.csv",fill=TRUE, header=FALSE, quote="\"", sep=",", encoding="UTF-8") 

mit der folgenden Reaktion:

V1 V2  V3   V4  V5 V6 
1 1 3 string  string4 <NA> NA 
2 2 5 string s\\tring\\4  3 NA 
3 1 3 string  stri,ng4  5 NA 
4 8 7 string  st\\ri n\\g4 5 

Das Problem scheint zu sein, dass das Komma innerhalb der maskierten Anführungszeichen in Zeile 5 als Trennzeichen interpretiert wird.

Ich erwarte/suche etwas wie folgt, aber ich bin mir nicht sicher, wie ich es bekommen soll.

V1 V2  V3   V4 V5 
1 1 3 string  string4 <NA> 
2 2 5 string s\"tring\"4  3 
3 1 3 string  stri,ng4  5 
4 8 7 string st\"ri,n\"g4  5 

ich die Datei grep ‚zu ändern, mit der Aufbereitung unter Berücksichtigung \“, aber ich bin neugierig, ob es eine direkte Methode ist. Es scheint wie ein potenziell weit verbreitetes Problem, aber ich eine guten nicht finden kann, . Beispiel eine Lösung

Gedanken, jemand

+0

gefunden diesen thread:?.. [link] (http://stackoverflow.com/questions/32103639/read-csv-file-in-r-with-double-quotes) Der Vorschlag für 'fread' aus' data.library' hat den Zweck erfüllt. –

+0

Cool! Aus Gründen der Information stammt fread aus data.table, nicht aus data.library –

Antwort

0

Versuchen read.table ("file_name.csv") unter Verwendung Es gab mir die gewünschte Ausgabe

+0

Dies führte nicht zu den gewünschten Ergebnissen. –

+0

Seltsam, es funktioniert für mich ... vielleicht, weil ich auf Unix und nicht auf Windows mit Rstudio versuche ... Welche Ergebnisse hat es dir produziert? –

Verwandte Themen