Ich möchte eine Aktion für eine einzelne Spalte ausführen. Leider, nachdem ich diese Spalte transformiert habe, ist sie jetzt nicht mehr ein Teil des Datenrahmens, von dem sie kam, sondern ein Column-Objekt. Als solches kann es nicht gesammelt werden. HierWie sammle ich eine einzelne Spalte in Spark?
ein Beispiel:
df = sqlContext.createDataFrame([Row(array=[1,2,3])])
df['array'].collect()
Dies erzeugt den folgenden Fehler:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'Column' object is not callable
Wie kann ich die collect()
Funktion auf einer einzigen Spalte verwenden?
so wählen Sie stattdessen der Subsetting wandelt dies im Wesentlichen in einen Ein-Spalten-Datenrahmen anstelle einer Spalte um. – Michal
Das ist richtig. 'Spalte' ist nur ein SQL-DSL-Ausdruck und keine eigenständige Datenstruktur. – zero323
Was ist das Äquivalent in Spark 2.0? Ich kann flatMap nicht als Methode auf dem Datenrahmen sehen. – ThatDataGuy