Ich habe einen Datenrahmen alspyspark UDF für mutils Spalten
import pandas as pd
ndf = pd.DataFrame({'a':[False, False,True,True,False], 'b':[False, False,False,False, True]})
ndf_s = sqlContext.createDataFrame(ndf)
Ich mag würde eine neue Spalte als „Aktion“ genannt bekommen. Dies könnte zwei Werte enthalten, wenn das ndf ['a'] True ist, hat die "action" einen Wert wie "I am a", wenn ndf ['b'] True ist, hat die "action" einen Wert wie "I am b" . Andernfalls erhält der Wert None. Für den Fall, beide Spalte wahr sind, dann Rückgabewert als "I a und b bin" .In anderen Worten würde Ich mag einen Datenrahmen erhalten, wie:
ndf_result = sqlContext.createDataFrame(pd.DataFrame({'a':[False, False,True,True,False], 'b':[False, False,False,False, True], 'action':[None, None, 'I am a', 'I am a', 'I am b']}))
gibt es eine Chance beiden Spalten wahr sind? – Psidom
möglich, in diesem Fall senden Sie die "Aktion" zu "Ich bin ein und b" –