Ich habe eine CSV-Datei, die Daten in doppelten Anführungszeichen enthalten haben (") 0001 " "A", "001"," 2017/01/01Funken - Lesen Sie CSV-Datei mit Zitat
." 12"
"0001", "B", "002", "2017.01.01 13"
ich mag nur reine Daten (ohne lesen "-Symbol).
spark.read
.option("encoding", encoding)
.option("header", header)
.option("quote", quote)
.option("sep", sep)
Andere Optionen funktionieren gut, aber nur Zitat scheint nicht ordnungsgemäß zu funktionieren. Es lädt mit Zitat Symbol ("). Wie soll ich dieses Symbol nehme von geladenen Daten aus.
dataframe.show Ergebnis
+----+----+------+---------------+
| _c0| _c1| _c2| _c3|
+----+----+------+---------------+
|0001| "A"| "001"| "2017/01/01 12"|
|0001| "B"| "002"| "2017/01/01 13"|
+----+----+------+---------------+
gleiche Ergebnis zu lesen. Danke tho :) –
Es funktionierte gut mit Ihren Beispieldaten für mich. –
könnten Sie mir Ihr Dataframe.show() Ergebnis für den Vergleich mit mir zeigen? –