groupby Zähler der Zeilen

Ich versuche, eine neue Variable zu erstellen, die zählt, wie oft die gleiche ID im Laufe der Zeit gesehen wurde.groupby Zähler der Zeilen

benötigen aus diesem Datenrahmen

id  clae6 year quarter   
    1 475230.0 2007   1     
    1 475230.0 2007   2      
    1 475230.0 2007   3      
    1 475230.0 2007   4      
    1 475230.0 2008   1 
    1 475230.0 2008   2   
    2 475230.0 2007   1      
    2 475230.0 2007   2      
    2 475230.0 2007   3     
    2 475230.0 2007   4     
    2 475230.0 2008   1  
    3 475230.0 2010   1  
    3 475230.0 2010   2  
    3 475230.0 2010   3  
    3 475230.0 2010   4

dazu

id  clae6 year quarter  new_variable  
    1 475230.0 2007   1   1 
    1 475230.0 2007   2   2    
    1 475230.0 2007   3   3    
    1 475230.0 2007   4   4   
    1 475230.0 2008   1   5 
    1 475230.0 2008   2   6 
    2 475230.0 2007   1   1   
    2 475230.0 2007   2   2   
    2 475230.0 2007   3   3   
    2 475230.0 2007   4   4   
    2 475230.0 2008   1   5 
    3 475230.0 2010   1   1 
    3 475230.0 2010   2   2 
    3 475230.0 2010   3   3 
    3 475230.0 2010   4   4

Ich verwende den folgenden Code passieren, aber vielleicht ist es ein einfacher (i über eine Menge von Datensätzen am Betrieb, also ich bin auf der Suche nach einem schnelleren Code):

df['control'] = 1 
df['new_variable'] = df.groupby(['id'])['control'].cumsum()

Quelle

2017-12-01 Lucas Dresl

Durch die Verwendung von cumcount

df.groupby('id').cumcount().add(1) 
Out[1574]: 
0  1 
1  2 
2  3 
3  4 
4  5 
5  6 
6  1 
7  2 
8  3 
9  4 
10 5 
11 1 
12 2 
13 3 
14 4 
dtype: int64

Quelle

2017-12-01 21:44:04 Wen

Wow, das funktioniert, danke! –

@LucasDresl yw ~ :-) – Wen

@LucasDresl Wenn es hilft, können Sie es akzeptieren – Wen

Sie können Rang verwenden

df['new'] = df.groupby('id').rank(method = 'first').astype(int) 

    id clae6 year quarter new 
0 1 475230.0 2007 1 1 
1 1 475230.0 2007 2 2 
2 1 475230.0 2007 3 3 
3 1 475230.0 2007 4 4 
4 1 475230.0 2008 1 5 
5 1 475230.0 2008 2 6 
6 2 475230.0 2007 1 1 
7 2 475230.0 2007 2 2 
8 2 475230.0 2007 3 3 
9 2 475230.0 2007 4 4 
10 2 475230.0 2008 1 5 
11 3 475230.0 2010 1 1 
12 3 475230.0 2010 2 2 
13 3 475230.0 2010 3 3 
14 3 475230.0 2010 4 4

Quelle

2017-12-01 21:41:34 Vaishali

groupby Zähler der Zeilen

Antwort

Verwandte Themen