Ich habe eine große csv-Datensatz, der einen Schmerz erweist sich in R. importierenR 3.3.2 Fehler beim Importieren der CSV mit read.table - Wahrscheinliche zitierte Ausgabe
Unten ist ein Beispiel des Datensatzes, mit alle der relevat Fragen:
col 1,col 2,col 3,col 4
txt 1,txt ' 2,"This is a big
field with carriage returns, all enclosed in double
quotes",txt 4
txt1,txt2,txt3,txt4
so wie Sie sehen können, gibt Probleme mit einfachen Anführungszeichen innerhalb von Feldern, doppelte Anführungszeichen umschließen große Blöcke von Texten sind die Kommas, und neue Zeilen in Felder (alle enthalten sollte in doppelte Anführungszeichen eingeschlossen). Felder enthalten jedoch keine Anführungszeichen, wenn sie keine Kommas und keine neuen Zeilen enthalten.
Ich habe
versuchtread.table(file, sep = ",", quote = '"', header = TRUE)
Aber ich erhalte die Fehler
Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec, :
line 31 did not have 95 elements
nicht sicher, was genau das Problem ist, aber ich bin sicher, dass es um die bedingten doppelten Anführungszeichen Texterkennungszeichen in engen Zusammenhang steht, die neuen Zeilen oder beides.
Irgendwelche Ratschläge zum Anpassen des Codes oder wie ich Fehler beheben könnte? Schätze jede Hilfe!
Nach rund 20 Antworten in mehreren Threads gehen über, habe ich gelernt, dass fread genial –