2017-08-04 1 views
0

Ich habe folgenden Datenrahmen data:Wie summiere ich Y-Werte für Bins, anstatt zu mitteln?

import pandas as pd 
from io import StringIO 
data = pd.read_table(StringIO("""time_diff avg_trips_per_day 
631   1.0 
231   1.0 
431   1.0 
7031  1.0 
17231  1.0 
20000  20.0 
21000  15.0 
22000  10.0"""), delim_whitespace=True) 

ich eine barchart als folows:

import seaborn as sns 
data['timegroup'] = pd.qcut(data['time_diff'], 3) 
sns.barplot(x='timegroup', y='avg_trips_per_day', data=data) 

Derzeit nimmt er die Werte von avg_trips_per_day für jeden Behälter (timegroup) und berechnet einen mittleren avg_trips_per_day. Allerdings möchte ich die Werte von avg_trips_per_day für jeden Fach timegroup anstelle von Mittelwert zusammenfassen. Wie kann ich das machen?

Antwort

3

den Schätzer Parameter von barplot Verwendung:

sns.barplot(x='timegroup', y='avg_trips_per_day', data=data, estimator=sum) 

enter image description here

+0

Dank. Übrigens ist in meinem Fall die untere Grenze des ersten bin aus irgendeinem Grund negativ, während ich in den Daten keine negativen Zahlen habe. Weißt du, wie man es repariert? – Dinosaurius

+0

@Dinosaurius Ich fürchte nicht. Es gibt einen IntervalIndex zurück, und diese sind nicht änderbar. Wahrscheinlich müssen Sie dafür den gesamten Index von Grund auf konstruieren. – ayhan

Verwandte Themen