Ich habe einen Datenrahmen mit einer kleinen Probe, die wie folgt aussieht:Subsetting gestapelt Pandas Datenrahmen
Country Item mean_area
84 Albania Sunflower seed 1900
85 Albania Tangerines, mandarins, clementines, satsumas 0
86 Albania Tobacco, unmanufactured 5700
87 Albania Tomatoes 5400
88 Albania Vegetables, freshnes 0
89 Albania Vegetables, leguminousnes 20
90 Albania Vetches 6200
91 Albania Watermelons 8300
92 Algeria Wheat 112000
93 Algeria Almonds, with shell 27150
Der vollständige Datenrahmen ist hier: https://www.dropbox.com/s/b413htrn39m2wzg/zzzzz.csv?dl=0
ich die Top 10 der Länder, basierend auf Summe auswählen möchten von mean_area (die vollständige Datenrahmen hat fast 200 Ländern), und wählen Sie die Top-5-Kulturen für jedes Land (wiederum bezogen auf mean_area)
ich die Top-10-Länder erhalten auf mean_area wie folgt auf:
df = (df_stacked
.loc[df_stacked['Country']
.isin(df_stacked.groupby('Country')
.sum()
.nlargest(10, 'mean_area').index)])
Wie wandle ich es dann in ein Dataframe mit nur Top 5 Ernten für jedes dieser Länder um.