Wie kann ich den Wert der ersten Zeile in Spalte b
und die letzte Zeile in Spalte b
von Gruppierung nach Spalte a
vergleichen, ohne die groupby
Funktion zu verwenden? Weil die groupby-Funktion für einen großen Datensatz sehr langsam ist.pandas dataframe erste und letzte Zeile jeder Gruppe vergleichen
a = [1,1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,3,3]
b = [1,0,0,0,0,0,7,8,0,0,0,0,0,4,1,0,0,0,0,0,1]
Return zwei Listen: eine mit den Gruppennamen aus col hat a
wobei der letzte Wert, der größer als der erste Wert ist, usw.
larger_or_equal = [1,3]
smaller = [2]
Ich weiß, ich habe eine Antwort für diese, wenn ich nur die Frage verstanden. Kannst du etwas mehr arbeiten, um zu erklären, worüber du redest? – piRSquared
Haben Sie versucht 'groupby (sort = False)'? Dies kann mit einem großen Dataset beschleunigen. – IanS
@piRSquared, Gruppen '1' und' 3' werden ausgewählt, weil das letzte Element in der Gruppe größer oder gleich dem ersten ist. – IanS