Ich benutze PySpark.Wie spalte ich die Spalte der Vektoren in zwei Spalten?
Spark Random Random Forest Ausgabe DataFrame hat eine Spalte "Wahrscheinlichkeit", die ein Vektor mit zwei Werten ist. Ich möchte nur zwei Spalten zum Ausgang DataFrame hinzufügen, "prob1" und "prob2", die dem ersten und zweiten Wert im Vektor entsprechen.
Ich habe versucht, die folgenden:
output2 = output.withColumn('prob1', output.map(lambda r: r['probability'][0]))
aber ich den Fehler, dass ‚col Spalte sein sollte‘.
Irgendwelche Vorschläge, wie man eine Spalte von Vektoren in Spalten seiner Werte umwandelt?
ich Ihren Vorschlag versucht, aber es erzeugt einen Fehler, ähnlich dem hier erwähnt: http://stackoverflow.com/questions/29910708/pyspark-py4j-pickleexception-expected-zero-arguments-for- Klassenbau – Petrichor