Ich habe folgende DF in Pandas:Pandas GROUPBY mit Zahl, sum und avg
+---------+--------+--------------------+
| keyword | weight | other keywords |
+---------+--------+--------------------+
| dog | 0.12 | [cat, horse, pig] |
| cat | 0.5 | [dog, pig, camel] |
| horse | 0.07 | [dog, camel, cat] |
| dog | 0.1 | [cat, horse] |
| dog | 0.2 | [cat, horse , pig] |
| horse | 0.3 | [camel] |
+---------+--------+--------------------+
Die Aufgabe, die ich ausführen möchte, ist nach Stichwort Gruppierung und gleichzeitig der Keyword-Frequenz zu zählen, im Durchschnitt beträgt und Summieren nach anderen Schlüsselwörtern. Das Ergebnis wäre so ähnlich sein:
+---------+-----------+------------+------------------------------------------------+
| keyword | frequency | avg weight | sum other keywords |
+---------+-----------+------------+------------------------------------------------+
| dog | 3 | 0.14 | [cat, horse, pig, cat, horse, cat, horse, pig] |
| cat | 1 | 0.5 | [dog, pig, camel] |
| horse | 2 | 0.185 | [dog, camel, cat, camel] |
+---------+-----------+------------+------------------------------------------------+
Nun, ich weiß, wie es in vielen getrennten Vorgängen zu tun: value_counts, groupby.sum(), groupby.avg() und Merging es dann. Es ist jedoch sehr ineffizient und ich muss viele manuelle Anpassungen vornehmen.
Ich frage mich, ob es möglich ist, es in einem Arbeitsgang zu tun?
Nizza wie 'sum' :-) +1 – pansen
@pansen auf Listen auch hier funktioniert - danke. – jezrael
Ich wusste, dass ich etwas falsch gemacht habe! Genau das habe ich gebraucht! Danke vielmals. – pawelty