2017-05-11 4 views
-3

Ich bin sehr Anfänger hier. Entschuldigung, wenn ich Frage/Duplikat gefragt habe.Liste der Spark SQL unterstützt Datenspeicher

Kommen zu Punkt, wie mein Produkt (Java-Web-Anwendung) fordert, muss ich eine Anwendung schreiben, die Daten zu einem der Datenspeicher (basierend auf einigen Konfigurationen) schieben sollte. Der Datenspeicher kann RDBMS, Hive oder ein beliebiger NoSQL-Datenspeicher sein. Also die Abfrage ist, ist SparkSql am besten für meinen Fall geeignet, wenn ja, kann ich eine Liste von Datenspeichern von Spark SQL unterstützt haben. Wenn Spark das nicht tut, sind sie andere Ansätze.

Bitte helfen Sie mir!

Antwort

0

Ja! SparkSql (Spark) ist die beste Lösung für Ihren Anwendungsfall. SparkSql unterstützt meines Wissens RDBMS, Hive und jeden NoSQL-Datenspeicher.

SparkSQL verfügt möglicherweise nicht über APIs zum direkten Zugriff auf wenige Speicher, aber mit ein wenig Hilfe von Sparks API sollten Sie in der Lage sein, einen beliebigen Datenspeicher zu verbinden.

Wir haben Spark verwendet, um eine Verbindung zu RDBMS, Cassandra, HBase, ElasticSearch, Solr, Hive, S3, HDFS usw. herzustellen.