Auf einem Ubuntu-Server habe ich Divolte Collector eingerichtet, um Clickstream-Daten von Websites zu sammeln. Die Daten werden in Hadoop HDFS (Avro-Dateien) gespeichert. (http://divolte.io/)Daten aus Hadoop HDFS mit SparkSQL-Konnektor lesen, um sie in Superset zu visualisieren?
Dann möchte ich die Daten mit Airbnb Superset visualisieren, die mehrere Anschlüsse zu gemeinsamen Datenbanken hat (dank SqlAlchemy), aber nicht zu HDFS.
Superset hat insbesondere einen Verbinder SparkSQL dank JDBC Hive (http://airbnb.io/superset/installation.html#database-dependencies)
So ist es möglich, es zu verwenden, um Daten abzurufen HDFS Klick? Dank
verfügbar sein, wenn Sie gefragt werden, ob Funke SQL HDFS anschließen können. Dann ist die Antwort ja. –