2016-04-12 2 views
1

Vor kurzem gibt es Entwicklung geht für die Apache Tajo Projekt. Das Projekt hat das Ziel, "erweiterte Open-Source-Data-Warehouse-System in Hadoop für die Verarbeitung von Web-Scale-Datensätzen".Was ist eigentlich der Unterschied zwischen Apache Tajo und Apache Bienenstock?

Da wir bereits Apache Hive als Data Warehouse für Hadoop haben und jetzt weit fortgeschritten und weit verbreitet sind, wie nützlich und anders wäre dieses neue Projekt für die Hadoop-Welt?

Antwort

-1

Wenn Sie Ihr Lager bereits stabil auf Hive haben, bin ich mir ziemlich sicher, dass Sie nicht kurzfristig wegziehen müssen. Ein paar Bereiche, die Tajo auf Zugang versuchen, sind:

  1. Niedrige Latenz-Abfragen (ad-hoc): Sie könnten schnell genug Ergebnisse werden immer mit Impala/Tez und Bienenstock-on-Funke kommt mit CDH 5.7. Für eine noch schnellere Antwort kann eine andere DB (nicht gewöhnlich DWH) verwendet werden.
  2. Volle SQL-Unterstützung: Solange Menschen, die Hive verwenden, bereits mit HQL vertraut sind, gibt es keine dringende Notwendigkeit für SQL. Obwohl Sie leicht verstehen können, warum es von Vorteil ist, volle SQL-Unterstützung zu haben.
Verwandte Themen