2017-06-03 2 views
0

Dieser Artikel bietet einen großartigen Überblick darüber, wie Spaltennamen geändert werden. How to change dataframe column names in pyspark?String-Manipulation für Spaltennamen in pyspark

Trotzdem brauche ich etwas mehr/leicht angepasst, dass ich nicht in der Lage bin zu tun. Kann jemand helfen, Räume von allen colnames zu entfernen? Es wird z.B. Join Befehle und der systematische Ansatz reduziert den Aufwand für den Umgang mit 30 Spalten. Ich nehme an, eine Kombination aus Regex und UDF würde am besten funktionieren.

Beispiel: Wurzel | - CLIENT: string (nullable = true) | - Zweignummer: string (nullable = true)

Antwort

0

Es ist eine echte einfache Lösung:

for name in df.schema.names: 
    df = df.withColumnRenamed(name, name.replace(' ', '')) 
+0

hat gut funktioniert, danke! –