2013-11-01 18 views
31

Ich möchte machen alle Spaltenüberschriften in meinem Pandas Datenrahmen KleinbuchstabenPython: Pandas Datenrahmen Spaltenüberschriften alle Klein

zum Beispiel machen, wenn ich:

data = 

    country country isocode year  XRAT   tcgdp 
0 Canada    CAN 2001 1.54876 924909.44207 
1 Canada    CAN 2002 1.56932 957299.91586 
2 Canada    CAN 2003 1.40105 1016902.00180 
.... 

Ich möchte XRAT ändern xrat durch so etwas wie tun:

data.headers.lowercase() 
Damit erhalte ich:

country country isocode year  xrat   tcgdp 
0 Canada    CAN 2001 1.54876 924909.44207 
1 Canada    CAN 2002 1.56932 957299.91586 
2 Canada    CAN 2003 1.40105 1016902.00180 
3 Canada    CAN 2004 1.30102 1096000.35500 
.... 

Ich werde nicht die Namen jeder Spaltenüberschrift vor der Zeit wissen.

Danke!

Antwort

60

Sie können es wie folgt tun:

data.columns = map(str.lower, data.columns) 

oder

data.columns = [x.lower() for x in data.columns] 

Beispiel:

>>> data = pd.DataFrame({'A':range(3), 'B':range(3,0,-1), 'C':list('abc')}) 
>>> data 
    A B C 
0 0 3 a 
1 1 2 b 
2 2 1 c 
>>> data.columns = map(str.lower, data.columns) 
>>> data 
    a b c 
0 0 3 a 
1 1 2 b 
2 2 1 c 
+3

Beachten Sie, dass dies zu doppelten Spaltennamen führen kann, wenn niedriger (Spalte1) == niedriger (Spalte2) (z. B. "A" und "A"). Dies kann unbeabsichtigte Konsequenzen haben, wenn später auf Spalten verwiesen wird. (z. B. gibt data ['a'] einen DataFrame zurück, keine Serie mit allen Spalten mit dem Namen 'a'). Sehen Sie sich dieses Beispiel an: https://gist.github.com/grisaitis/170e82a008480acb4fa3 – grisaitis

+0

'[x.lower() für x in data.columns]' entspricht: '[x.lower() für x in Daten] ' – joctee

9

Wenn Sie die Umbenennungs mit einer verketteten Methodenaufruf tun möchten, können Sie Verwenden Sie

data.rename(
    columns=unicode.lower 
) 

(Python 2)

oder

data.rename(
    columns=str.lower 
) 

(Python 3)

27

Sie es leicht mit str.lower für columns tun können:

df.columns = df.columns.str.lower() 

Beispiel:

In [63]: df 
Out[63]: 
    country country isocode year  XRAT   tcgdp 
0 Canada    CAN 2001 1.54876 9.249094e+05 
1 Canada    CAN 2002 1.56932 9.572999e+05 
2 Canada    CAN 2003 1.40105 1.016902e+06 

In [64]: df.columns = df.columns.str.lower() 

In [65]: df 
Out[65]: 
    country country isocode year  xrat   tcgdp 
0 Canada    CAN 2001 1.54876 9.249094e+05 
1 Canada    CAN 2002 1.56932 9.572999e+05 
2 Canada    CAN 2003 1.40105 1.016902e+06 
Verwandte Themen