Ich habe Probleme herauszufinden, wie Sie Daten in eine statische Partition einer Hive-Tabelle mit Spark SQL einfügen. Ich kann Code verwenden in dynamische Partitionen zu schreiben:Einfügen von Daten in eine statische Hive-Partition mit Spark SQL
df.write.partitionBy("key").insertInto("my_table")
aber ich kann nicht herausfinden, wie die Daten in eine statische Partition einzufügen. Das heißt, ich möchte die Partition definieren, in die der gesamte DataFrame geschrieben werden soll, ohne dass die Spalte zum DataFrame hinzugefügt werden muss.
Ich sehe statische Partitionierung in der Klasse erwähnt, so denke ich, es wird unterstützt. Gibt es eine öffentliche API, um zu tun, was ich will?
waren Sie ähnliche jede API finden können, in dynamische Partition schreiben? – Explorer
Nein, ich konnte nichts finden und registrierte die RRD als temporäre Tabelle und führte SQL INSERT aus. Allerdings wurde ein großer Teil des Hive-Codes in Spark 2.0 neu geschrieben, so dass es jetzt möglich ist. –