Ich habe einen Datenrahmen von "Sätzen", aus denen ich nach einem Schlüsselwort suchen möchte. Nehmen wir an, mein Keyword ist nur der Buchstabe "A". Beispieldaten:Python pandas counting
year | sentence | index
-----------------------
2015 | AAX | 0
2015 | BAX | 1
2015 | XXY | -1
2016 | AWY | 0
2017 | BWY | -1
Das heißt, die „Index“ Spalte zeigt den Index des ersten Auftretens von „A“ in jedem Satz (-1, wenn nicht gefunden). Ich möchte die Zeilen in ihren jeweiligen Jahren zusammenfassen, mit einer Spalte, die den Prozentsatz des Auftretens von "A" in den Aufzeichnungen jedes Jahres zeigt. Das heißt:
year | index
-------------
2015 | 0.667
2016 | 1.0
2017 | 0
ich das Gefühl, dass diese agg
oder groupby
in irgendeiner Art und Weise geht, aber ich bin mir nicht klar, wie diese zusammen zu bespannen. Ich habe so weit gekommen wie:
df.groupby("index").count()
Aber die hier Ausgabe eine Art bedingter Zählung() ersten, wo wir zuerst die Anzahl der Zeilen in Jahr 201X zählen ‚A‘ enthalten, dann Dividieren, dass nach der Anzahl der Zeilen im Jahr 201X.