Ich versuche, zwei Datenrahmen mit den gleichen Spaltennamen zu verbinden und einige neue Werte zu berechnen. Danach muss ich alle Spalten der zweiten Tabelle fallen lassen. Die Anzahl der Spalten ist riesig. Wie kann ich es einfacher machen? Ich habe versucht, .drop ("table2. *"), Aber das funktioniert nicht.Spark SQL-Datenrahmen alle Spalten aus Alias-Tabelle nach Join
0
A
Antwort
1
Sie select
mit Aliasnamen verwenden:
df1.alias("df1")
.join(df2.alias("df2"), Seq("someJoinColumn"))
.select($"df1.*", $"someComputedColumn", ...)
Referenz mit der Mutter DataFrame
:
df1.join(df2, Seq("someJoinColumn")).select(df1("*"), $"someComputedColumn", ...)
0
Statt Abwurf, können Sie alle notwendigen Spalten auswählen, die Sie wie für weitere Operationen etwas halten wollen unter
val newDataFrame = joinedDataFrame.select($"col1", $"col4", $"col6")
Verwandte Themen
- 1. Spark Join Rückgabe Null Werte in den Spalten
- 2. Spark mehrere Bedingungen Join
- 3. Wählen Sie richtige Spalten aus JOIN-Anweisung
- 4. Spark Sql Join vs Funke Dataframe Join
- 5. Postgresql die gleichen Spalten aus dem JOIN
- 6. Spark Dataset API - Join
- 7. Spark Join funktioniert nicht
- 8. Wählen Sie alle Spalten aus einer Tabelle und einige aus einer anderen mit linken Join
- 9. LINKER JOIN mit ID-Spalten für alle verbundenen Tabellen
- 10. SQL Join nach Distinct
- 11. alle Spalten der Join-Bedingungen (dplyr) angegeben Zurück
- 12. Verknüpfen Sie zwei Datenrahmen, wählen Sie alle Spalten aus einem und einige Spalten aus dem anderen
- 13. Änderung der Schema-Reihenfolge nach Join-Operation in Spark (JAVA)
- 14. Konvertieren von Zeilen in Spalten dynamisch nach einem Join
- 15. Spark DataFrame und Umbenennen mehrerer Spalten (Java)
- 16. Excel Extra Spalten nach alle löschen
- 17. Spark SQL - Wählen Sie alle UND berechneten Spalten?
- 18. Spark Cassandra Connector Join auf Clustering-Schlüssel
- 19. SQL-Join mit NULL-Spalten
- 20. Spalten Join Zeilen
- 21. Zend wählt alle Spalten
- 22. Spalten aus ResultSet nach Tabelle entfernen
- 23. alle Spalten aus den beiden Funktionstabellen postgresql wählen
- 24. Wie wählt man alle Spalten aus mehreren Tabellen im Code mit Join?
- 25. SQL JOIN bekomme Daten aus der linken Tabelle Nur wenn alle richtigen Spalten übereinstimmen
- 26. Doppelte Spalten in Spark-Dataframe
- 27. Join drei Spalten Spalten in einem Datenrahmen
- 28. alle Spalten aus zwei Tabellen auswählen
- 29. Wie doppelte Spalten nach einem JOIN in Pig entfernen?
- 30. Scala Spark: Datensatz mit JSON Spalten
Es ist kein Fall, wenn ich haben wie 50 Spalten + 50 Spalten in der zweiten Tabelle. Kann ich "table1. *" + Namen der neuen Spalten auswählen – Mike
hoffe, dass dies http://Stackoverflow.com/a/35341524/1025328 hilft –