Ich beschloss, Skew und Kurtosis Funktionen in Pandas und Scipy.stats zu vergleichen, und verstehe nicht, warum ich unterschiedliche Ergebnisse zwischen den Bibliotheken bekomme.Was ist der Unterschied zwischen Skew und Kurtosis Funktionen in Pandas vs Scipy?
Soweit ich aus der Dokumentation ersehen kann, berechnen beide Kurtosis-Funktionen mit Fisher-Definition, während für Skew scheint es nicht genug einer Beschreibung zu sagen, ob es große Unterschiede gibt mit, wie sie berechnet werden.
import pandas as pd
import scipy.stats.stats as st
heights = np.array([1.46, 1.79, 2.01, 1.75, 1.56, 1.69, 1.88, 1.76, 1.88, 1.78])
print "skewness:", st.skew(heights)
print "kurtosis:", st.kurtosis(heights)
dies zurück:
skewness: -0.393524456473
kurtosis: -0.330672097724
während, wenn ich zu einem Pandas Datenrahmen umwandeln:
heights_df = pd.DataFrame(heights)
print "skewness:", heights_df.skew()
print "kurtosis:", heights_df.kurtosis()
dies zurück:
skewness: 0 -0.466663
kurtosis: 0 0.379705
Entschuldigt, wenn ich habe das geschrieben am falschen Ort; nicht sicher, ob es eine Statistik oder eine Programmierfrage ist.