Transformation mehr Spalten in einem mit Pandas

Ich habe einen Datenrahmen als so strukturiert: Transformation mehr Spalten in einem mit Pandas

Ich frage mich, was die effizienteste Art und Weise in Pandas ist eine neue Spalte „Stufe“, die jeden Wert extrahiert zu erstellen, die isn 't' None 'in den vier Spalten und verwende diesen Wert für die Spalte' stage '. Die verbleibenden vier Spalten können dann gelöscht werden, nachdem die Stage-Spalte einen Wert extrahiert hat, der in keiner Zeile None ist.

Hier ist eine weitere Momentaufnahme der eindeutigen Werte jeder Spalte beteiligt:

Bitte beachten Sie, dass die Werte in den Spalten in Frage String-Typ sind und keine ist nicht wirklich Nonetype.

Quelle

2017-12-27 Keenan Burke-Pitts

Haben Sie etwas dagegen eine tatsächliche Datenrahmen und Code anstelle der Bilder zu teilen? – user32185

df['New']=df[['A','B','C']].replace('None','').sum(1) 
df 
Out[1477]: 
     A  B  C New 
0 None  B None B 
1  A None None A 
2 None None  C C

Dateneingabe

df=pd.DataFrame({'A':['None','A','None'],'B':['B','None','None'],'C':['None','None','C']})

Quelle

2017-12-27 15:52:07 Wen

danke! das hat funktioniert. Ich verstehe jedoch nicht den .sum (1) Teil des Codes. Kannst du erklären, was dort vor sich geht? –

@ KeenanBurke-Pitts Summe (1), summiert die df Zeile für Zeile, es ist String, es wird sie zusammenfügen :-) (PS: Ich ersetze alle Keine sein '') – Wen

danke für die Hilfe! –

Betrachten combine_first, unter der Annahme, Keine ist kein Stringliteral 'None'.

df['stage'] = df['doggo'].combine_first(df['floorfer'])\ 
         .combine_first(df['pupper'])\ 
         .combine_first(df['puppo'])

Alternativ für DRY-er Ansatz verwenden reduce:

from functools import reduce 
... 

df['stage'] = reduce(lambda x,y: x.combine_first(y), 
        [df['doggo'], df['floorfer'], df['pupper'], df['puppo']])

Quelle

2017-12-27 16:03:16 Parfait

Transformation mehr Spalten in einem mit Pandas

Antwort

Verwandte Themen