Ist es möglich, mehrere Dateien als einen Datenrahmen zu laden? Normalerweise, wenn ich eine Datei zu laden, werde ich zum Beispiel nennen:Mehrere Dateien in Dataframe laden
file1 = "https://stackoverflow.com/a/b/c/folder/file1.csv"
dc = sqlContext.read.format('com.databricks.spark.csv').options(header='false', inferschema='true').load(file1)
Aber ich mag alle Dateien im Ordner /a/b/c/folder/*.csv
laden.
Was passiert, wenn Sie 'dc = sqlContext.read.format ('com.databricks.spark.csv') versuchen. header = 'false', inferschema = 'true'). load ("a/b/c/ordner/*. csv") 'Gibt es einen Fehler? Funktioniert es? –
Ich bekomme einen Fehler "java.lang.ArrayIndexOutOfBoundsException: 18002" – hdy