Ich versuche, eine neue Variable zu erstellen, die zählt, wie oft die gleiche ID im Laufe der Zeit gesehen wurde.groupby Zähler der Zeilen
benötigen aus diesem Datenrahmen
id clae6 year quarter
1 475230.0 2007 1
1 475230.0 2007 2
1 475230.0 2007 3
1 475230.0 2007 4
1 475230.0 2008 1
1 475230.0 2008 2
2 475230.0 2007 1
2 475230.0 2007 2
2 475230.0 2007 3
2 475230.0 2007 4
2 475230.0 2008 1
3 475230.0 2010 1
3 475230.0 2010 2
3 475230.0 2010 3
3 475230.0 2010 4
dazu
id clae6 year quarter new_variable
1 475230.0 2007 1 1
1 475230.0 2007 2 2
1 475230.0 2007 3 3
1 475230.0 2007 4 4
1 475230.0 2008 1 5
1 475230.0 2008 2 6
2 475230.0 2007 1 1
2 475230.0 2007 2 2
2 475230.0 2007 3 3
2 475230.0 2007 4 4
2 475230.0 2008 1 5
3 475230.0 2010 1 1
3 475230.0 2010 2 2
3 475230.0 2010 3 3
3 475230.0 2010 4 4
Ich verwende den folgenden Code passieren, aber vielleicht ist es ein einfacher (i über eine Menge von Datensätzen am Betrieb, also ich bin auf der Suche nach einem schnelleren Code):
df['control'] = 1
df['new_variable'] = df.groupby(['id'])['control'].cumsum()
Wow, das funktioniert, danke! –
@LucasDresl yw ~ :-) – Wen
@LucasDresl Wenn es hilft, können Sie es akzeptieren – Wen