ich einen Datenrahmen, die wie folgendes Bild aussieht: nlargest Werte von Multi-Index-Datenrahmen erhalten
Hier uid und id sind Indizes. Dieser Datenrahmen wurde aus einem einzelnen Indexdatenrahmen konvertiert, sodass für einige Spalten doppelte Werte vorhanden sind. Für jede UID sind alle Werte für avg_diff gleich, aber unterschiedliche UID werden unterschiedliche Werte für dieses Feld haben. Ich möchte die größten 10 avg_diff Werte mit verschiedenen Uids erhalten.
Hinweis: Dies ist ein riesiger Datenrahmen, so suche ich nach dem optimierten Weg.
Verwenden 'print (df [~ Maske] .nsmallest (2, 'avg_diff'))' – jezrael
Oder 'df [~ mask] .sort_values ('avg_diff'). Kopf (2)' – jezrael