Ich habe ein Datenformat, das in dieser Form ist.Sortieren von Daten in Datenrahmen gruppiert nach mehreren Spalten
Type Major GPA
F A 2.6
T B 3.4
T C 2.9
F A 1.8
T B 2.8
F C 3.5
...
würde ich zu einer Gruppe wie die Datenrahmen („Studenten“) von Type
und Major
, die Anzahl der Zeilen für jede Gruppierung zählen, dann Art, die aus bis zu später beliebten Majors für jeden Typ, und schließlich Erstellen Sie einen neuen Datenrahmen, der die 20 beliebtesten Majors enthält.
ich die Ausgabe möchte wie folgt aussehen:
F
A 21
B 19
C 15
...
T
A 14
B 7
C 3
Das ist, was ich tat:
most_popular = students.groupby(['Type', 'Major']).size().sort_values(ascending=False)[:20]
Aber was dies tut, ist Art über beiden Typen - eher als Art separat für jeder.
Vielen Dank für Ihre Hilfe.
Leider nicht. Es sortiert die Ergebnisse nach Major - alphabetisch sortiert statt nach GPA. –
@JamesEaves Siehe oben Bearbeiten. – Alexander