Ich habe csv
mit Zeilenumbruch in Spalte. Im Anschluss ist mein Beispiel:lesen csv-Datei in doppelte Anführungszeichen, aber mit Zeilenumbruch
"A","B","C"
1,"This is csv with
newline","This is another column"
"This is newline
and another line","apple","cat"
ich die Datei in Funken lesen kann, aber die Neuen-Zeile in der Spalte als eine separate Zeile behandelt.
Wie kann ich das als csv mit Text innerhalb Doppelanführungszeichen bereit.
Ich lese Datei mit beiden Apache-CSV-Plugin und nur Apache.
alarms = sc.textFile("D:\Dataset\oneday\oneday.csv")
Das gibt mir RDD:
**example.take(5)**
[u'A,B,C', u'1,"This is csv with ', u'newline",This is another column', u'"This is newline', u'and another line",apple,cat']
Spark-Version: 1.4
'line.replace ('/ n',‘ ') if line.count (' '')% 2 == 1 und '"\ n' nicht in Zeile ' –