Ich muss vielleicht mit Kafka arbeiten und ich bin absolut neu dazu. Ich verstehe, dass es einen Kafka-Produzenten gibt, der die Protokolle von Kafka-Themen bekommt.Spark Streaming von Kafka Consumer
Ich werde arbeiten, um von Kafka Themen über Verbraucher zu lesen. Muss ich zuerst die Consumer-API einrichten, dann kann ich mit dem SparkStreaming-Kontext (PySpark) streamen oder kann ich das KafkaUtils-Modul direkt verwenden, um von Kafka-Themen zu lesen?
Falls ich die Kafka Consumer-Anwendung einrichten muss, wie mache ich das? Bitte teilen Sie Links zu den richtigen Dokumenten.
Vielen Dank im Voraus!
Es heißt an Orten, die es nicht Python unterstützt. Haben Sie versucht, Streams von Kafka zu lesen? Können Sie bitte ein Code-Snippet teilen, das selbst kleine Logs von dort verbraucht? –
oh yeah es wird nicht in pyspark unterstützen, damit du deinen eigenen Stream erstellen kannst http://spark.apache.org/docs/latest/streaming-custom-receivers.html –