I haben folgende Beispieldatenrahmen wie folgt definiert:pandas.nlargest() - verwechseln mit wiederholten Indexwerte
df1 = pandas.DataFrame(data = {"Age":[28, 3, 32, 18], "Student":[False, True, False, False]}, index = ["Jack", "Sam", "Nate", "Jack"])
und die Ausgabe folgt.
Wenn ich 2 Zeilen mit größten Alten Werten extrahieren möge, verwende ich pandas.nlargest(2, "Age")
und der Ausgang hat drei Reihen statt zwei, wie folgend:
Wenn ich versuche, für 4 größte Alter Werten pandas.nlargest(4, "Age")
, ist das Ergebnis eher verwirrend, wie folgend:
Ich bin verwirrt über den Grund dafür zu verstehen.
Welche Version von 'Pandas' verwenden Sie? Ich habe dein Beispiel ausprobiert und es funktioniert richtig: 'df1.nlargest (2,' Age ')' gibt zwei Zeilen mit dem größten 'Alter' zurück. Siehe auch https://github.com/pandas-dev/pandas/issues/13412 Ich habe Pandas ver. 0.19.2 – user35603
Die Version ist 0.19.1. Ich habe auch versucht, Online-Python-Shells, aber das Ergebnis ist das gleiche. –
@ user35603 Ich aktualisiert und das Problem ist gelöst. Ich schätze sehr viel.Du hast mich vor stundenlangen Kopfschmerzen bewahrt –