Dies ist ein Beispiel für meinen Datenrahmen:Pandas: Gruppe von gleich Bereich
df_lst = [
{"wordcount": 100, "Stats": 198765, "id": 34},
{"wordcount": 99, "Stats": 98765, "id": 35},
{"wordcount": 200, "Stats": 18765, "id": 36},
{"wordcount": 250, "Stats": 788765, "id": 37},
{"wordcount": 345, "Stats": 12765, "id": 38},
{"wordcount": 456, "Stats": 238765, "id": 39},
{"wordcount": 478, "Stats": 1934, "id": 40},
{"wordcount": 890, "Stats": 19845, "id": 41},
{"wordcount": 812, "Stats": 1987, "id": 42}]
df = pd.DataFrame(df_lst)
df.set_index('id', inplace=True)
df.head()
DF:
Stats wordcount
id
34 198765 100
35 98765 99
36 18765 200
37 788765 250
38 12765 345
Ich mag die durchschnittlichen Stats
für jeden Bereich von wordcount
mit einem berechnen Schritt von 100 so sieht der neue Datenrahmen in etwa so aus:
Average wordcount
194567 100
23456 200
2378 300
...
Wo 100 bedeutet fr om 0-100 usw. Ich habe angefangen, mehrere Bedingungen zu schreiben, habe aber das Gefühl, dass es einen effizienteren Weg gibt, dies zu erreichen. Ich schätze deine Hilfe.
OH mein Gott gleich gleich. Du schaffst das. – Dark
@Bharath, tut mir leid, dass :) – MaxU
Ich war in der Regel schnell mit pd.cut aber diesmal nicht. – Dark