Ich habe dies df wie diese strukturiert, wo jedes Jahr die gleichen Zeilen/Einträge hat:eine Bedingung zu einer df Anwendung des Aggregats zu erhalten zählt
Year Name Expire
2001 Bob 2002
2001 Tim 2003
2001 Will 2004
2002 Bob 2002
2002 Tim 2003
2002 Will 2004
2003 Bob 2002
2003 Tim 2003
2003 Will 2004
ich die df (df [df [subsetted haben‘ Expire ']> df [' Year '])
2001 Bob 2002
2001 Tim 2003
2001 Will 2004
2002 Tim 2003
2002 Will 2004
2003 Will 2004
Jetzt möchte ich die Zählung für jedes Jahr die Menge von Namen zurückzugeben, die abgelaufen ist, so etwas wie:
Year count
2001 0
2002 1
2003 1
Wie kann ich das erreichen? Ich kann nicht (df [df ['Expire'] < = df ['Jahr']) ['name']. Groupby ('Jahr'). Agg (['count']), weil das würde nicht unnötig zurückkehren Zeilen für mich. Kann ich nur die letzte Instanz zählen?
ist nicht 'df.groupby ([ 'Ablaufen']) [ 'Name']. Count()', was Sie brauchen? –