Ich habe versucht, mehrere .gz
Dateien von Hadoop-Dateisystem über Spark-Streaming zu lesen. Gibt es eine Möglichkeit, das zu tun? Wenn ja, können Sie mir eine LösungWie verarbeitet man mehrere .gz-Dateien über Spark-Streaming?
0
A
Antwort
-1
Spark Streaming-Prozess-Datei auf der Grundlage der Zeitstempel, d. h. nur die Dateien wurden verarbeitet, die zu bestimmten Pfad nach dem Start der Spark-Streaming hinzugefügt werden. Spark-Streaming verarbeitet keine Dateien, die vor dem Start des Streamingkontexts platziert werden.
In einfachen Worten Streaming funktioniert auf Live-Daten nicht auf den alten.
Verwandte Themen
- 1. Message in KafkaUtils010 SparkStreaming
- 2. SparkStreaming/Kafka Offset Handhabung
- 3. Wie verarbeitet man mehrere WebSockets in Python auf FIFO-Art?
- 4. Wie verarbeitet man Parameter, die über $ resource get gesendet werden?
- 5. Wie verarbeitet man ein Objektliteral?
- 6. Wie verarbeitet man JSON Fehlermeldung
- 7. Wie verteilt man Tempdb über mehrere Dateien?
- 8. Wie man über mehrere erwartete Zeilen iteriert
- 9. Wie wird die Zahlungsauthentifizierung über Stripe in iOS (Swift) verarbeitet?
- 10. Wie verarbeitet man die Vektoreingabe in StateFlow?
- 11. Wie verarbeitet man einige HTTP-Sitzungen?
- 12. Wie verarbeitet man Informationen in einem Bild?
- 13. Wie verarbeitet man große Anzahl Dateien
- 14. Wie verarbeitet man JSON mit jquery?
- 15. Wie verarbeitet man "parallele" Sequenzen in Linq?
- 16. Wie verarbeitet man KML/GeoJSON in Nodejs?
- 17. Wie verarbeitet man Anmerkungen mit @Target (ElementType.TYPE_USE)?
- 18. Wie verarbeitet man Std-Container mit Threads?
- 19. Wie verarbeitet man Daten-Javascript mit PHP?
- 20. Wie verarbeitet man ein Django-Queryset?
- 21. Wie verarbeitet man große Binärdaten in Clojure?
- 22. Wie verarbeitet man CIDR-Block/Textverarbeitung?
- 23. , dass mehrere Anfragen verarbeitet werden nacheinander
- 24. Wie MySql Composite-Index verarbeitet
- 25. Wie werden mehrere Dateien separat nach SparkContext.wholeTextFiles verarbeitet?
- 26. APT Wie man Anmerkungen von verschachtelten annotierten Klassen verarbeitet
- 27. Wie verarbeitet man Daten in mehreren Threads mit EJB3?
- 28. Wie ermittelt man, welcher SSAS Cube gerade verarbeitet?
- 29. Wie werden über ein WebBrowser-Steuerelement heruntergeladene Elemente verarbeitet?
- 30. Wie verarbeitet man JPG-Bilder am einfachsten mit c/C++?