Ich habe einen Datenrahmen von Studenten Testergebnissen erhalten, wo die beiden Spalten, die ich country
und result
, wie sind interessieren:Ermitteln der relativen Häufigkeiten für eine kategoriale Variable (gefiltert nach Anzahl)?
country result
FR Pass
FR Fail
US Pass
US Pass
DK Fail
DK Fail
SE Pass
... ...
Was ich versuche, herauszufinden, ist, wie man die relative " Fail "Häufigkeit pro Land, absteigend (das heißt - ich will die Studenten aus diesem Land, die versagt haben, als Prozentsatz aller Studenten aus diesem bestimmten Land), aber nur für Länder, die über 200 Absolventen hatten, die den Test bestanden haben:
country % fail students
FR 0.056 997
US 0.051 855
DK 0.042 627
NL 0.032 511
Ich habe Kollegen bei der Arbeit gesehen tun es mit einem ver y kurze SQL-Abfrage, aber für das Leben von mir kann ich nicht herausfinden, wie man es mit Pandas macht!
Ihre Eingangsdaten unvollständig sind ... darüber hinaus, was Sie bisher in Python versucht haben? Es ist kein Ort, wo Sie einen kostenlosen Kaffee haben ... –