Wenn die Kappa-Architektur die Analyse direkt im Stream durchführt, anstatt die Daten in zwei Streams zu teilen, wo ist dann der Datenspeicher in einem Nachrichtensystem wie Kafka? oder kann es in ein
Ich baue eine Lambda-Architektur, ich habe die Streaming-Ebene codiert und jetzt mache ich die Batch-Ebene. Zu diesem Zweck verwende ich Spark 2 als Batch-Prozessor und HDFS als Stammdaten. SparkSess
Ich versuche eine Lambda-Architektur mit den folgenden Tools zu implementieren: Apache Kafka, um alle Datenpunkte, Spark für Stapelverarbeitung (Big Data), Spark Streaming für Echtzeit (Fast Data) und