2017-03-15 6 views
0

Ich versuche, meine DataFrame in CSV-Datei zu schreiben. Ich habe versucht, diesenVersuchen, DataFrame in CSV-Datei zu schreiben

df.write.format("com.databricks.spark.csv").option("header", true) 
    .option("codec", "org.apache.hadoop.io.compress.GzipCodec").save("myFile.csv") 

aber es gibt mir den Fehler:

java.lang.UnsupportedOperationException: CSV data source does not support array<struct<columnName:columntype... 

wenn ich jedoch den Datenrahmen auf der Konsole zeigt, druckt es in Ordnung. Wie kann ich in eine CSV oder sogar eine Textdatei schreiben?

Danke !!

EDIT

Ich brauche nicht alles zu schreiben. Ich habe die benötigten Zeilen ausgewählt und habe es funktioniert, danke für die Hilfe!

+0

Können Sie das Schema von DataFrame ('df.schema') bereitstellen? – himanshuIIITian

Antwort

2

Ihr Dataframe hat eine komplexe Spalte (ein Array von Strukturen scheint es). Mit csv können Sie nur einfache Spaltentypen wie String, Int, Date usw. haben, aber keine Arrays oder Strukturen.

Verwandte Themen