Ich habe einen Pandas Datenrahmen mit vielen Spalten, zwei von ihnen sind "Filmtitel" und "Alter", ich möchte die Top 5 Filme mit dem niedrigsten Altersdurchschnitt finden die Leute, die sie bewertet haben, aber nur Filme, die mindestens 100 Bewertungen haben (also in mindestens 100 Reihen erscheinen).Anzahl der doppelten Werte und Reihenfolge in einem Pandas Datenrahmen finden
Zum Beispiel:
movie title age
Title 1 10
Title 2 12
Title 2 12
Title 3 13
Title 3 13
Title 3 13
Sollte sich:
movie title # of ratings avg age
Title 1 1 10
Title 2 2 12
Title 3 3 13
Es kann in den gleichen oder einen neuen Datenrahmen sein. Danke für Ihre Hilfe!
könnten Sie nicht die "Filter" -Methode nach groupby direkt verwenden? –
Dies scheint nicht Filme mit weniger als 100 Bewertungen herauszufiltern, wenn ich es laufe? – user2453297
Es funktioniert, wenn der Datenrahmen nur die Spalten Filmtitel und Alter hat. Siehe Bearbeiten oben für die Fehlerbehebung. – Alexander