Was ist der richtige Weg, DF in Hive interne Tabelle im Append-Modus einzufügen. Es scheint, dass wir den DF direkt mit der Methode "saveAsTable" in Hive schreiben können oder den DF in die temporäre Tabelle speichern und dann die Abfrage verwenden.Wie Einfügen von Spark DataFrame in Hive Interne Tabelle?
df.write().mode("append").saveAsTable("tableName")
ODER
df.registerTempTable("temptable")
sqlContext.sql("CREATE TABLE IF NOT EXISTS mytable as select * from temptable")
Wird der zweite Ansatz fügen Sie die Aufzeichnungen oder überschreiben?
Gibt es eine andere Möglichkeit, die interne Tabelle DF in Hive effektiv zu schreiben?
Es hängt davon ab, wie (Typ) Ihre Tabellen und wo gespeichert werden. – FaigB