0
Ich habe eine Liste in pyspark, die das folgende Format hat:Dropping Element aus der Liste pyspark
[(u'category1',
[u'a',
u'b',
u'c',
u'd']),
(u'category2',
[u'v',
u's',
u'g',
u'd'])]
Ich möchte die Kategorie Elemente aus dieser Liste löschen. Gibt es einen sauberen Weg, dies in Pyspark zu tun?
Nicht vertraut mit pyspark. Kannst du ein Listenverständnis verwenden? '[x [1] für x in meiner_liste]' –
Wie wäre es damit [(x [1],) für x in l]? –
Meinst du eine 'rdd'? Sie können wahrscheinlich einfach 'rdd.map (lambda x: x [1])' – mtoto