I eine CSV-Datei, die Zeilenumbrüche innerhalb von Spalten umfasst:Importieren CSV-Datei mit Zeilenumbrüchen in R oder Python Pandas
"id","comment","x"
1,"ABC\"xyz",123
2,"xyz\"abc",543
3,"abc
xyz",483
ID 3, beispielsweise enthält eine solche Zeilenumbruch.
Wie kann dies in Python oder R importiert werden? Es macht mir auch nichts aus, wenn diese Zeilenumbrüche beispielsweise durch ein Leerzeichen ersetzt werden.
werfen Sie einen Blick auf diese, http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html, können Sie Trennzeichen, Header und so ziemlich alles, was Sie brauchen, setzen. Es ist nur 'df = pd.read_csv (Pfad zur Datei)' –
Zeilenumbrüche werden kein Problem sein, sie werden korrekt von R's 'read.csv' und Pandas '' read_csv' behandelt. In Ihrer Datei sind die doppelten Anführungszeichen jedoch nicht richtig maskiert (es sollte "" statt "" sein), und dieser Punkt könnte problematisch sein. – Scarabee
In R hat 'read.csv' Probleme mit der Escape-Funktion, aber' readr :: read_csv' und 'data.table :: fread' Handle es gut ohne weitere Parameteranpassung – alistaire