2016-08-10 1 views
0

Ich bin nur ein Anfänger zu pyspark und Datenrahmen mein dtaframe ist df([('one',1),('two',2),('three',3)],[('four',4)]) , also möchte ich X zu jedem der ersten Elemente im Tupel verketten. ex onex, twox,threex,fourx. jede Hilfe wird geschätzt. df.select() gibt nur die Elemente in der ersten Liste. mkExtrahieren von Elementen aus einem Tupel in Datenframe in pyspark

+0

Es ist unmöglich, dass Sie einen Dataframe aus 'df ([('one', 1), ('two', 2), ('three', 3)], [('four', 4)] konstruieren) '. – ShuaiYuan

Antwort

0
from pyspark.sql.functions import udf, col 
from pyspark.sql.types import StringType 

def append_x(val): 
    return val + 'x' 

df = df.withColumn(
    'appended', 
    udf(append_x, StringType())(col(colInput)) 
) 

Beachten Sie, dass colInput ist der Name der Spalte möchten Sie x anhängen.

Verwandte Themen