Was wäre der effizienteste Weg, groupby zu verwenden und parallel einen Filter in Pandas anzuwenden?Pandas: Was ist das Äquivalent von SQL-Gruppe mit?
Grundsätzlich für das Äquivalent in SQL von
Ich frageselect *
...
group by col_name
having condition
Ich denke, es gibt viele Einsatzfälle reichen von bedingten Mittel, Summen, bedingten Wahrscheinlichkeiten usw., die ein solcher Befehl würde sehr mächtig.
Ich brauche eine sehr gute Leistung, also wäre ein solcher Befehl im Idealfall nicht das Ergebnis mehrerer geschichtet Operationen in Python.
@AndyHayden hat ein [nettes Beispiel] (http://stackoverflow.com/a/18357933/190597) von 'groupby-filter' geschrieben. Ich denke, der "Filter" ist das Pandas-Äquivalent der "Haben-Bedingung". – unutbu