Wie speichere ich Kafka-Spark-Streaming-Nachrichten: Datenrahmen in einzelne DateiWie Kafka-Spark-Streaming-Nachrichten: Datenrahmen in einzelne Datei
ich eine Anwendung speichern entwickelt haben, die die Nachrichten mit Kafka- Spark-Streaming-Prozess verbraucht wird.
Sobald die Daten empfangen werden, wird es in Datenrahmen umgewandelt.
Dann Streaming-Datenrahmen wird als Textdatei gespeichert, hier ist der Datenrahmen in jeder Datei für jede Kafka-Stream-Nachricht gespeichert, unten ist der Code, den ich verwendet habe, um Datenrahmen in Textdatei zu speichern, dies speichert Daten um die Textdatei für jede Nachricht zu multiplizieren.
DF.coalesce(1).write.format("com.databricks.spark.csv").mode("append")
.save("path")
Hier ist die Anforderung Ich mag würde Datum Rahmen erreichen, ist das Streaming müssen als eine einzige Datei für jede kafka Nachricht gespeichert werden, wenn möglich, bitte mich mit der Lösung zu helfen.
Vielen Dank im Voraus