Ich möchte SQL
Abfragen auf S3
Dateien/Eimer durch HIVE
ausführen. Ich habe keine Ahnung, wie Setup zu tun ist. Schätze deine Hilfe.Run HIVE auf S3?
0
A
Antwort
0
Sie zuerst eine EXTERNAL TABLE
erstellen, die das Datenformat und zeigt auf die Stelle in Amazon S3 definiert:
CREATE EXTERNAL TABLE s3_export(a_col string, b_col bigint, c_col array<string>)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
LOCATION 's3://bucketname/path/subpath/';
Sie können dann aus der Tabelle mit den normalen SELECT
Befehle, zum Beispiel:
SELECT b_col FROM s3_export
Alternativ können Sie Amazon Athena verwenden, um Hive-like-Abfragen erneut Daten in Amazon S3 auszuführen, ohne dass sogar ein Hadoop-Cluster erforderlich ist. (Es basiert tatsächlich auf Presto syntax, die Hive sehr ähnlich ist.)
Verwandte Themen
- 1. Remember letzten Dateinamen erstellt von Hive auf S3
- 2. Hive auf S3 Multi aws Benutzer und Funken
- 3. Export Dynamodb zu S3 mit Hive
- 4. So lesen Sie die S3 XML-Dateiabfrage mit dem Hive
- 5. Hive-Ergebnisse werden nicht im S3-Bucket gespeichert
- 6. Laden von Daten mit Hive, S3, EMR und Recover Partitions
- 7. run Lambda in jedem der S3-Objekt in einem Eimer
- 8. komprimierte (gzip) Daten von s3 in den Hive importieren
- 9. Problem beim Erstellen von Hive externen Tabelle mit s3-Speicherort
- 10. Run mehrere Stock sql auf Apache Nifi
- 11. HIVE auf Spark-Ausgabe
- 12. einen Tisch auf Hive
- 13. TIMESTAMP auf HIVE-Tabelle
- 14. Hive SQL auf Aquastudio
- 15. Hive mit emrfs
- 16. Run tensorflow auf gpu
- 17. Run Artefactory auf Browser
- 18. Run Grunt auf ElasticBeanstalk
- 19. Run OpenBlas auf Multicore
- 20. Run Websocket auf GAE
- 21. Run Webseite auf localhost
- 22. So registrieren Sie S3-Parkettdateien in einem Hive-Metastore mit Spark auf EMR
- 23. CFDirectory Erstellen auf S3?
- 24. MP3-Schnipsel auf s3
- 25. Spark-SQL-Abfrageausführung auf Hive
- 26. Aktivieren von Hive auf Cygnus
- 27. auf einem Tisch in Hive
- 28. Umwandlung einer Zeichenfolge auf hive
- 29. Hive auf Spark-unendliche Verbindungen
- 30. Führt Thread.currentThread(). SetName() die Methode run run auf?