Ich erstelle einen neuen Dataframe aus einem vorhandenen Datenframe, muss jedoch in diesem neuen DF eine neue Spalte ("field1" in unterem Code) hinzufügen. Wie mache ich das? Beispielcode für das Arbeiten mit Beispielcode wird geschätzt.Erstellen eines neuen Datenrahmens mit leeren Feldwerten
val edwDf = omniDataFrame
.withColumn("field1", callUDF((value: String) => None))
.withColumn("field2",
callUdf("devicetypeUDF", (omniDataFrame.col("some_field_in_old_df"))))
edwDf
.select("field1", "field2")
.save("odsoutdatafldr", "com.databricks.spark.csv");
@ zero323, vielen Dank für das Teilen, sehr hilfreich. Siehe meine Änderungen für Unterstützung anderer Typen. –
@DmitriySelivanov Vielen Dank für Ihre hilfreiche Bearbeitung. Ich habe die Idee aufgegeben, 'Option' nach einigen fehlgeschlagenen Experimenten mit Literalen vor einer Weile zu verwenden :) – zero323
hinweis:' toDF() 'erfordert' import spark.implicits._' – Boern