Ich würde gerne mehrere Aggregationen in Spark Structured Streaming machen.Mehrere Aggregationen in Spark Structured Streaming
Etwas wie folgt aus:
- einen Strom von Eingabedateien lesen (aus einem Ordner)
- Führen Aggregation 1 (mit einigen Transformationen)
- Perform Aggregation 2 (und Transformationen)
Wenn ich dies in Structured Streaming ausführe, gibt es mir einen Fehler "Mehrere Streaming-Aggregationen werden nicht unterstützt Streaming von Datenrahmen/Datasets".
Gibt es eine Möglichkeit, solche Mehrfachaggregationen in Structured Streaming durchzuführen?
Haben Sie versucht, die niedrigere 'DStream'-Abstraktion zu verwenden? –
Ich hatte gehofft, strukturiertes Streaming (Datasets/Dataframes) zu verwenden. Kannst du mich auf ein Beispiel hinweisen, wo etwas Ähnliches mit DStream gemacht wurde? – Kaptrain