ich eine CSV-Datensatz haben, die wie folgt aussieht:Python Stacked Bar gefärbt von Kategorie
Account Months_since_Open Gender Age_Group
XXXXX 12 Male Millennial
YYYYY 24 Female 71+
ZZZZZ 20 Female 55-70
Der Datensatz für Millionen von Zeilen weiter. Grundsätzlich möchte ich ein Balkendiagramm, das Monate_Seit_Offen auf der X-Achse und Anzahl der Konten (Häufigkeit) auf der Y-Achse hat. Außerdem möchte ich, dass die Balken nach Altersgruppe gefärbt sind.
Bisher das ist, was ich habe:
import pandas as pd
import numpy as np
import statsmodels.api as sm
import pylab as pl
from scipy import stats
from sklearn.externals.six import StringIO
from sklearn import preprocessing
from sklearn import cluster, tree, decomposition
import matplotlib.pyplot as plt
import pydot
import os
import seaborn as sns
df1 = pd.read_csv("LiveSeg.csv")
sexgroup = df.groupby('Gender')
Female = df[(df['Gender'] == 'FEMALE')]
plt.hist(Female.AcctAge_Months.dropna(),bins =50)
Das gibt mir die folgende Ausgabe:
Wie kann ich diese Balken sind vom% der Kunden in der Altersgruppe gefärbt? Ich benutze Python 3.4.4 Danke
Also, im Grunde wollen Sie, dass jeder Balken eine andere Farbe hat? –
Nein, ich möchte, dass jeder Balken entsprechend seiner Altersgruppe farbig ist. Grundsätzlich, wenn Millennials 50% der Konten in einem dieser Bars geöffnet hat, möchte ich, dass dieser Balken 50% gelb gefärbt ist, die nächsten 25% waren ab der Altersgruppe 71+ dann sollte der Balken 50% gelb, 25% rot und sein bald –