2016-10-26 4 views
2

Ich habe eine Spalte in meinem Datenrahmen, der wie ein Index formatiert ist:Spalte (im Indexformat) zu Dataframe?

0  [u'Basketball', u'Swimming', u'Gym'] 
1  [u'Gym', u'Soccer', u'Football'] 
2  [u'Ballet', u'Basketball', u'Volleyball'] 

Gibt es eine einfache Möglichkeit für mich, dies zu bereinigen (entfernen Sie die u, und die eckigen Klammern) aufgeteilt sie dann durch (‘ , ') dass Sport zu drei Säulen gruppiert ist?

Antwort

2

betrachten s

s = pd.Series([ 
     "[u'Basketball', 'Swimming', 'Gym']", 
     "[u'Gym', u'Soccer', u'Football']", 
     "[u'Ballet', u'Basketball', u'Volleyball']" 
    ]) 
s 

0   [u'Basketball', 'Swimming', 'Gym'] 
1    [u'Gym', u'Soccer', u'Football'] 
2 [u'Ballet', u'Basketball', u'Volleyball'] 
dtype: object 

schnellste Weg ist, um applyeval

s.apply(eval) 

0   [Basketball, Swimming, Gym] 
1    [Gym, Soccer, Football] 
2 [Ballet, Basketball, Volleyball] 
dtype: object 

bekommen einen Datenrahmen

s.apply(eval).apply(pd.Series) 

enter image description here

+0

Arbeitete perfekt, danke! – Carla

Verwandte Themen