2016-11-07 2 views
5

Ich möchte mehrere Spalten aus vorhandenen Datenrahmen (die nach Joins erstellt wird) auswählen und möchte die fileds als meine Zieltabellenstruktur bestellen. Wie kann es gemacht werden? Der Ansatz, den ich benutzt habe, ist unten. Hier kann ich die erforderlichen Spalten auswählen, die ich aber nicht nacheinander ausführen kann.So wählen und bestellen Sie mehrere Spalten in einem Pyspark-Dataframe nach einem Join

Die account_sk_id muss auf dem 2. Platz sein. Was ist der beste Weg, dies zu tun?

Antwort

6

Try Spalten durch nur eine Liste geben, nicht durch Iterieren existings Spalten oder Ordnung der Auswahl sollte in Ordnung sein:

account_sk_df_ld = account_sk_df.select(*hist_columns) 
+0

Ja .. Das ist für mich gearbeitet. Und du erklärst mir bitte, was passiert ist. Die Felder waren in der Liste. – user3858193

+0

In spark können Sie Spalten auswählen, indem Sie ihre Namen als Strings angeben (aber nur, wenn sie im aktuellen Datenrahmen eindeutig sind). – Mariusz

Verwandte Themen