2016-10-24 5 views
0

Ich habe eine Liste in pyspark, die das folgende Format hat:Dropping Element aus der Liste pyspark

[(u'category1', 
    [u'a', 
    u'b', 
    u'c', 
    u'd']), 
(u'category2', 
    [u'v', 
    u's', 
    u'g', 
    u'd'])] 

Ich möchte die Kategorie Elemente aus dieser Liste löschen. Gibt es einen sauberen Weg, dies in Pyspark zu tun?

+1

Nicht vertraut mit pyspark. Kannst du ein Listenverständnis verwenden? '[x [1] für x in meiner_liste]' –

+1

Wie wäre es damit [(x [1],) für x in l]? –

+0

Meinst du eine 'rdd'? Sie können wahrscheinlich einfach 'rdd.map (lambda x: x [1])' – mtoto

Antwort

0

Da die Kommentare unten meine Frage sagen, das ist die Antwort:

[x[1] for x in my_list] 
Verwandte Themen