Ich Analyse von Protokollen und ich habe diese Architektur:Elasticsearch Spark Streaming
kafka-> Funken Streaming -> Elasticsearch
Mein Hauptziel ist es Modelle für maschinelles Lernen im Streaming zu erstellen. Ich denke, dass ich zwei Dinge tun:
1) Kafka-> Funken Streaming (ML) -> Elasticsearch
2) Kafka-> Funken Streaming-> Elasticsearch -> Funken Streaming (ML)
-Ich denke, dass die zweite Architektur die beste ist, da Spark-Streaming indizierte Daten direkt verwendet. Was denken Sie? Ist das korrekt? -Können wir Sparks Streaming in Echtzeit mit elasticsearch verbinden? -Wenn wir ein Modell im Spark-Streaming (nach elastischer Suche) erstellen, müssen wir dieses Modell an dieser Stelle verwenden (nach elasticsearch) oder können wir es im Spark-Streaming (directery nach kafka) verwenden? # use == in Echtzeit voraussagen -Das Erstellen von Modellen nach elasticsearch machte unsere Modelle statisch (oder nicht in Echtzeit)
Vielen Dank.
Elasticsearch ist nicht 'Echt Time' System. __Source__: https://www.elastic.co/guide/en/elasticsearch/reference/current/_basic_concepts.html#_near_realtime_nrt – avr
In der Dokumentation sagten sie, dass es 1 Sekunde dauert, um durchsuchbar zu werden, also denkst du, es ist dasselbe transformiert werden, um Funken zu strömen? Sonst denkst du Kafka-> Sparking Streaming (ML) -> elastische Suche ist besser? Vielen Dank für Ihre Antwort. –
Alles jenseits von '1 Sekunde' ist keine Echtzeit mehr. Wenn Sie möchten, dass Ihre Anwendung "Echtzeit" ist, dann kann elasticsearch nicht dazu dienen, egal wo (nach dem Funken-Streaming oder vorher) Sie hineinlegen. – avr