2017-05-03 4 views
1

bei dieser Suche:Cloudera Hive auf Spark 2.x?

https://www.cloudera.com/documentation/spark2/latest/topics/spark2_known_issues.html#hive_on_spark

zusammenfassen zu, heißt es Hive funktioniert nicht auf Spark-2.x in Cloudera.

Allerdings gehe ich davon aus Hive auf Spark-2.x in anderen Distributionen laufen wird. Hat jemand CDH 5.10.x oder höher konfiguriert, um Hive auf Spark 2.x auszuführen?

Ist Spark-2.x einen großen Sprung nach vorne Spark 1.6?

+0

Ja, Spark 2.x _ ist ein großer Schritt vorwärts von Spark 1.6. Ich habe Hive mit Spark 2.x nicht in meinen Cloudera-Bereitstellungen verwendet, aber ich möchte Sie ermutigen, auch in den Cloudera-Benutzerforen nachzufragen und hier zu antworten. – Garren

+0

Nicht sicher, aber mein Verständnis davon ist das folgende: Hive-On-Spark 2 ist das Konzept der Verwendung von Spark 2 als Ausführungs-Engine von Hive. Sogar ohne Hive-On-Spark 2 können Sie Spark 2 verwenden und mit Hive-Tabellen arbeiten (wir tun dies mit CDH 5.8 und das funktioniert einwandfrei) –

+0

Sie meinen also, Sie greifen auf die Hive-Metadaten und schreiben dann benutzerdefinierte Spark-Jobs mit und die zugrunde liegenden Daten, die es beschreibt? Ich denke, das könnte nützlich sein, aber wir würden es vorziehen, Hive-Abfragen mit Spark 2.x als exe-Engine auszuführen. Wir können dies mit Spark 1.6 auf Cloudera tun. – medloh

Antwort

1

Die neueste veröffentlichte Version von Hive ist ab sofort 2.1.x und unterstützt Spark 2.x nicht (siehe https://issues.apache.org/jira/browse/HIVE-14029). Wenn die Hive-Version 2.2.0 veröffentlicht wird, unterstützt sie Spark 2.x.

+0

Hive 2.3.0 ist jetzt verfügbar und unterstützt Spark 2.0 - http://www-us.apache.org/dist/hive/hive-2.3.0/ –

Verwandte Themen