Elasticsearch vs hbase/Hadoop für Echtzeit-Statistiken

ich Millionen von kleinen Block Dokumenten wöchentlich loggin zu tun:Elasticsearch vs hbase/Hadoop für Echtzeit-Statistiken

Ad-hoc-Abfragen für Data-Mining-
Beitritt zu vergleichen, Filtern und Berechnen von Werten
viel viel Volltextsuche mit python
ausführen, um diese Operationen mit allen Millionen von Dokumenten, einige Male täglich

Mein erster Gedanke war, dass alle Dokumente in HBase/HDFS abgelegt wurden und Hadoop-Jobs ausgeführt wurden, die Statistikergebnisse erzeugten.

Das Problem ist: einige der Ergebnisse müssen in der Nähe von Echtzeit sein.

Also, nach ein paar Recherchen entdeckte ich ElasticSearch und jetzt denke ich über die Übertragung aller Millionen von Dokumenten und verwenden Sie DSL-Abfragen, um Statistiken Ergebnisse zu generieren.

Ist das eine gute Idee? ElasticSearch scheint mit Millionen/Milliarden von Dokumenten so einfach zu handhaben zu sein.

Quelle

2014-02-26 user3175226

Für Echtzeit-Suche Analytics Elastic Search ist eine gute Wahl.
Definitiv einfacher einzurichten und zu handhaben als Hadoop/HBase/HDFS.
Elastic-Suche vs HBase Gut Vergleich: http://db-engines.com/en/system/Elasticsearch%3BHBase

Quelle

2014-02-26 15:48:53 Jasper

Elasticsearch vs hbase/Hadoop für Echtzeit-Statistiken

Antwort

Verwandte Themen