Ich möchte wissen, wie viele Menschen GRADE
1, 2, 3, 4 und 5 zu den Gruppen von Menschen putted, die die Bewertungen 1 mal, zwischen 2 und 3 mal und mehr als 3 mal gemacht haben. Zum Beispiel enthält die Gruppe von Personen, die die Bewertungen einmal durchführen, Personen mit der ID 2
und 4
. In dieser Gruppe gibt es insgesamt eine Auswertung 5
und eine Auswertung 1
. Ich bekomme Gesamtzahl der PersonenWie gruppiert man Reihen nach Häufigkeit?
result =
FREQUENCY_GROUP GRADE_1 GRADE_2 GRADE_3 GRADE_4 GRADE_5
"1 time" 1 0 0 0 1
"2-3 times" 3 2 0 0 1
"> 3 times" 0 2 1 0 1
Wenn ich diese df.groupby(['EVALUATION_GRADE']).agg({'ID_PERSON': 'count'}).reset_index()
tun, dann die 1
, 2
, 3
, 4
und 5
geputtet:
df =
ID_PERSON EVALUATION_GRADE
1 2
1 2
1 3
1 5
2 5
3 2
3 5
3 1
4 1
5 2
5 1
5 1
Das Ergebnis sollte diese sein. Wie kann ich sie in Frequenzgruppen aufteilen?
Nur zu verstehen. Würden diese 'Bins = [-np.inf, 1, 3, 5, np.inf]' diese 'Labels = [' 1 mal ',' 2-3 mal ',' 4-5 mal ','> 5 bedeuten mal '] '? – user7379562
Ya, sehe ich Problem stattdessen -inf brauchen '0', sorry. – jezrael
Ich kann es jetzt nicht testen, weil ich nur telefoniere. – jezrael