Ich verwende die Java Spark API, für die KafkaUtils.createDirectStream, möchte ich den Offset verfolgen. Es gibt einen Parameter fromOffset, der den Offset in Partitionen des Kafka-Themas aufzeichnet. für den ersten Durchlauf habe ich keine Ahnung, wie viele Partitionen ich haben werde, wie kann ich dann diesen Parameter einstellen? Und muss ich "Auto.offset.reset" in Kafka Parameter setzen? Wenn ja, wird es meinen Code beeinflussen, um von einem bekannten Offset zu erholen?Spark Streaming Kafka anfänglichen Offset
0
A
Antwort
0
Sie haben zwei Möglichkeiten:
falls Sie keine Informationen über partions haben, bieten nicht, dass param zu createDirectStream. Es gibt mehrere Implementierungen der createDirectStream-Methode. In diesem Fall oder frühestes oder spätestes Offset für jede topicPartition wird verwendet (basierend auf dem
auto.offset.reset
param)Sie können die Partitionen, Versätze, die übliche kafka API verwenden. Zum Beispiel aussehen How to find the offset range for a topic-partition in Kafka 0.10?
+0
Vielen Dank! Gibt es überhaupt Kafka 0.8? als 0.10 ist experimentelle API – peng
Verwandte Themen
- 1. Kafka Spark-Streaming Offset Ausgabe
- 2. Spark Streaming Kafka Stream
- 3. Kafka Spark-Streaming-Integration
- 4. Spark Streaming Kafka Gegendruck
- 5. Spark + Kafka streaming NoClassDefFoundError kafka/serializer/StringDecoder
- 6. Spark-Streaming und Kafka-Integration
- 7. Spark Streaming Kafka java.lang.ClassNotFoundException: org.apache.kafka.common.serialization.StringDeserializer
- 8. Spark-Streaming und Kafka-Integration
- 9. Spark Streaming von Kafka Consumer
- 10. Spark-Streaming: Kafka Gruppen-ID nicht in Spark-Structured Streaming
- 11. SparkStreaming/Kafka Offset Handhabung
- 12. Kafka Spark Streaming XML Parsing/Verarbeitung
- 13. Spark Streaming Kafka direkte Verbraucherverbrauch Geschwindigkeit fallen
- 14. Push Daten zu Kafka von Spark Streaming
- 15. Null Wert in Spark Streaming von Kafka
- 16. Spark Streaming mit Kafka 2.0.0 Abhängigkeiten
- 17. Kafka und Spark Streaming Simple Producer Verbraucher
- 18. Erstellen eines Kafka-Konsumenten mit Spark-Streaming
- 19. CSV von Kafka an Spark senden Streaming
- 20. Spark-Kafka-Streaming gibt Inkompatible Jackson Ausnahme
- 21. Spark Streaming: java.lang.NoClassDefFoundError: kafka/api/TopicMetadataRequest
- 22. Spark-Streaming - Kafka- createStream - RDD zu Datenrahmen
- 23. Spark-Streaming mit Kafka - createDirectStream vs createStream
- 24. Kafka Thema Partitionen zu Spark-Streaming
- 25. Avro an Spark-Streaming über Kafka senden
- 26. Beitreten Streaming basierend auf Schlüssel - Spark/Kafka
- 27. Spark-Streaming mit Kafka: leere Sammlung Ausnahme
- 28. java.lang.NoClassDefFoundError: org/apache/spark/streaming/kafka/KafkaUtils
- 29. Spark-Streaming-Streaming aktiv Zählung
- 30. Offset-Management für Apache Kafka mit Apache Spark Batch
Wenn Sie nicht wissen, die Anzahl der Partitionen, woher wissen Sie, Offset für jede Partition zu starten? – Mariusz
Wenn ich die "auto.offset.reset" auf die kleinste oder größte, kann ich immer noch die Partition und Offset-Informationen von jedem roten – peng