Mein Anwendungsfall ist eine unbeschränkte Streaming-Pipeline, die Daten in festen stündlichen Fenstern verarbeitet. Ich muss jedoch die Daten aus den vorherigen Fenstern wissen. Gibt es eine Möglichkeit, die Daten in einer ArrayList irgendwo im Speicher zu speichern, oder muss ich sie irgendwo in eine db schreiben?Apache Beam In-Memory-Speicher
Ich versuche, Schiebefenster zu vermeiden, weil nur ein Teil der Verarbeitung diese Daten aus dem vorherigen Fenster benötigt, und ich wollte Überschneidungen so weit wie möglich vermeiden.
Hey @jfkk, danke für die Anleitung. Ich bin immer noch sehr neu in Apache Beam, also werde ich wahrscheinlich eine Weile brauchen, um die Konzepte zu verstehen. Aber die neuen Entwicklungen sehen sicherlich aufregend aus und scheinen meinem Anwendungsfall vielversprechend zu verleihen. Ich arbeite an der Verarbeitung einiger Iot-Daten und wenn Daten eintreffen, muss ich identifizieren, ob sie in derselben Charge sein sollen (um mit der gleichen Kennung versehen zu werden). Es gibt jedoch keine bestimmte zeitliche Begrenzung für die Dauer eines Stapels. Um die Daten zu verarbeiten, möchte ich einige Parameter angeben, um zu dokumentieren, wo die Verarbeitung im vorherigen Fenster "ausgelassen" wurde. – jlyh