2017-07-11 9 views
0

Ich habe eine pd.DataFrame, die ich plotten möchte und passen Sie eine Glockenkurve über. Ich bin soweit gekommen, das Histogramm zu zeichnen. Wie passe ich die Glockenkurve an?Plot Normalverteilung mit pd.hist

wordfreq = pd.DataFrame(columns=vocab, index = authors, data = rates) 
wordfreq.hist(column='the', grid = False, normed = True, color = '#9ebcda')[:25] 
plt.rcParams['axes.facecolor'] = 'white' 
plt.title("use of 'the' women") 

histogram

+0

Ich frage mich, wenn Sie KDE (Kerndichte Schätzung) in diesem Fall Seaborns distplot (oben erwähnt) wird standardmäßig überlagern. – JohnE

+0

Danke, das war einfach. – Lunalight

+0

[** Wenn Sie wissen wollten, wie man es ohne Seeschneur macht **] (https://stackoverflow.com/a/39987117/2336654) – piRSquared

Antwort

1

kann seaborn Paket verwenden als:

seaborn.distplot(wordfreq[column]) 
+0

die Daten von 0-20 verschwanden. Ist das wegen der Kde? – Lunalight

+0

yeah vielleicht aber wenn du nicht kde willst, dann stellst du es auf false als 'distplot (kde = False)' – shivsn

1

die Glockenkurve nur durch zwei Parameter definiert ist mean und variance welche man leicht per numpy.mean berechnen und numpy.std

wenn Sie nur eine Kerndichte-Schätzung ohne a wünschen ny Parametereinstellung Verwendung seaborn und distplot(data = wordfreq[column])

+0

ja sorry, du bist total korrekt und danke für deine Erwähnung. Ich werde es bearbeiten –