Ich habe eine Liste, die, sagen wir mal, sieht wie folgt aus (die ich in eine DF bin setzen):Pandas: Drop quasi-Duplikate von Spaltenwerte
[
['john', '1', '1', '2016'],
['john', '1', '10', '2016'],
['sally', '3', '5', '2016'],
['sally', '4', '1', '2016']
]
columns
sind ['name', 'month', 'day', 'year']
I grundsätzlich wollen Sie einen neuen DF mit nur der ältesten Zeile für jede Person ausgeben. Es sollte also zwei Zeilen enthalten, eine für John am 1/1/16 und eine für Sally am 3/5/16.
Ich hatte immer eine harte Zeit mit dieser Art von Auswahl innerhalb DF's und hoffte, dass jemand einen Ratschlag geben könnte, wie man das oben genannte erreicht.
Sortierung nach 'name' nicht notwendig ist, ist es? –
Nein, aber ich wollte die Namen zusammenhalten, wenn ich auf ein Zwischenergebnis schauen wollte. Nicht notwendig, obwohl. – piRSquared