Ich möchte Apache Kafka Connect verwenden, um Dateien auf einem Linux-Server zu verarbeiten.So verwenden Sie Kafka Connect mit vorhandenen und neuen Dateien (Watch-Ordner)
Anwendungsfall: Ich habe einen Ordner mit 2 Millionen XML-Dateien in Unterordnern. Ich möchte sie alle nach Apache Kafka in Reihenfolge ihres Zeitstempels schieben. Dann möchte ich den Ordner und die Unterordner nach neuen Dateien durchsuchen und sie auch in der Reihenfolge der Ankunft an Kafka senden.
Ist das möglich? Oder muss ich diesen Prozess aufteilen? Sind Plugins verfügbar?