Ich frage mich, ob mir jemand mit einer kleinen Abfrage helfen könnte. Ich habe derzeit einen massiven Datensatz mit einer großen Anzahl von Zeilen und wollte einen kleineren Datenrahmen erstellen dass zieht nur zwei Spalten aus den größeren und wie oft jeder Name in diesem Kapitel in diesem Fall ‚Vorkommen‘ aufgetretenDie am häufigsten aufgerufenen Namen in einem Dataset basierend auf bestimmten Spalten
Der Code unten ist, was ich
df1 = (Dec16.groupby(["BNF Chapter", "Name"]).size().reset_index(name="Occurrence"))
df1
bin mit Aufgetragen diese
BNF Chapter Name Occurrence
1 Aluminium hydroxide 2
1 Aluminium hydroxide + Magnesium trisilicate 2
1 Alverine 702
.......
21 Polihexanide 2
21 Potassium hydroxide 32
21 Sesame oil 22
21 Sodium chloride 222
Was ich möchte, ist die Top 10 am häufigsten aufgetretenen Namen für ein bestimmtes Kapitel, wie der Datensatz so groß ist.
Zum Beispiel kann ein Datenrahmen, die nur Die Top 10 häufigsten Namen in Kapitel 1
Wie würde ich diese gehen über das Tun zieht?
Vielen Dank !!!