0
Ich habe folgenden Datenrahmen data
:Wie summiere ich Y-Werte für Bins, anstatt zu mitteln?
import pandas as pd
from io import StringIO
data = pd.read_table(StringIO("""time_diff avg_trips_per_day
631 1.0
231 1.0
431 1.0
7031 1.0
17231 1.0
20000 20.0
21000 15.0
22000 10.0"""), delim_whitespace=True)
ich eine barchart als folows:
import seaborn as sns
data['timegroup'] = pd.qcut(data['time_diff'], 3)
sns.barplot(x='timegroup', y='avg_trips_per_day', data=data)
Derzeit nimmt er die Werte von avg_trips_per_day
für jeden Behälter (timegroup
) und berechnet einen mittleren avg_trips_per_day
. Allerdings möchte ich die Werte von avg_trips_per_day
für jeden Fach timegroup
anstelle von Mittelwert zusammenfassen. Wie kann ich das machen?
Dank. Übrigens ist in meinem Fall die untere Grenze des ersten bin aus irgendeinem Grund negativ, während ich in den Daten keine negativen Zahlen habe. Weißt du, wie man es repariert? – Dinosaurius
@Dinosaurius Ich fürchte nicht. Es gibt einen IntervalIndex zurück, und diese sind nicht änderbar. Wahrscheinlich müssen Sie dafür den gesamten Index von Grund auf konstruieren. – ayhan