Verbinden von zwei Tabellen mit unterschiedlicher Spaltenanzahl in Spark

Wie verknüpfe ich zwei Datenrahmen A und B, die unterschiedliche Spalten enthalten und Nullen für Spalten erhalten, die in den Datenrahmen A und B nicht üblich sind?Verbinden von zwei Tabellen mit unterschiedlicher Spaltenanzahl in Spark

kann ich, dass Funken sehen unionAll diese Aktion nicht unterstützt und wirft folgende Fehler

org.apache.spark.sql.AnalysisException: Union can only be performed on tables with the same number of columns, but the left table has 11 columns and the right has 10;

Spark-Version: 1.6.1

Quelle

2016-08-03 Omley

ich weiß nicht von irgendwelchen DBMS wher Diese Abfrage würde mit verschiedenen Spaltenstrukturen in den unionierten Tabellen funktionieren. – Siyual

@ Siyual Danke für die Eingabe. Korrigiert entsprechend – Omley

Rewrite Ihre Abfrage, damit es alle Spalten festgelegt und mit null as missing_field für Spalte zu kompensieren Sie haben nicht

SELECT field1, field2, field3 FROM A UNION ALL SELECT field1, field2, null as field3 FROM B

Quelle

2016-08-03 20:39:09 Anton

Gibt es einen automatisierten Weg, auf dem ich die Inspektion von Spalten einzeln vermeiden kann, um nicht übliche Spalten zu identifizieren? – Omley

Sie könnten versuchen, * aus einer Union wählen Sie alle *, Null als Feld3 von B, aber ich bin mir nicht sicher, ob das in Ihrer Konfiguration funktionieren würde. – Anton

Verbinden von zwei Tabellen mit unterschiedlicher Spaltenanzahl in Spark

Antwort

Verwandte Themen