Im Folgenden ist der Inhalt meiner CSV-Datei:Funken keine Spalten mit Nullwerten in der ersten Reihe lesen
A1,B1,C1
A2,B2,C2,D1
A3,B3,C3,D2,E1
A4,B4,C4,D3
A5,B5,C5,,E2
So gibt es 5 Spalten, aber nur drei Werte in der ersten Reihe.
Ich las es mit dem folgenden Befehl:
val csvDF : DataFrame = spark.read
.option("header", "false")
.option("delimiter", ",")
.option("inferSchema", "false")
.csv("file.csv")
Und nach ist das, was ich csvDF.show()
+---+---+---+
|_c0|_c1|_c2|
+---+---+---+
| A1| B1| C1|
| A2| B2| C2|
| A3| B3| C3|
| A4| B4| C4|
| A5| B5| C5|
+---+---+---+
Wie kann ich alle Daten in allen Spalten gelesen werden verwendet?
ist es möglich, alle 5 Spalten jeder Zeile hinzufügen? Wie für Zeile 1 anstelle von A1, B1, C1 ist es A1, B1, C1 ,, – Tom
Das ist nur eine Problemumgehung und wird nicht funktionieren, wenn der CSV von jemand anderem verwaltet wird. –
Geben Sie einfach Schema manuell –