In Python habe ich Zeitreihendaten. Der Schlüssel der Daten Datum und der Name und die Daten haben vier Attribute: A, B, C und D.Python - Zusammenfassung Statistiken mit Datum und Name
Ich brauche eine Zusammenfassung der Datenanalyse auf diesem Datensatz zu tun:
1) Für jeden Namen , den Durchschnitt von A, B, C und D
2) Für jeden Namen, die Standardabweichung von A, B, C und D
3) Für jeden Namen, Zählnummer NaN des als Prozentsatz des Gesamt für jede A, B, C und D
Ich bin vertraut mit R aber nicht python. Wenn Sie mir in die richtige Richtung zeigen können, wäre das mehr als genug! Vielen Dank.
asof_dt = pd.date_range('20151231','20160130')
df1=pd.DataFrame(np.random.randn(len(asof_dt),4),index=asof_dt,columns=('A','B','C','D'))
df1['name']='alpha'
df2=pd.DataFrame(np.random.randn(len(asof_dt),4),index=asof_dt,columns=('A','B','C','D'))
df2['name']='beta'
df3=pd.DataFrame(np.random.randn(len(asof_dt),4),index=asof_dt,columns=('A','B','C','D'))
df3['name']='gama'
df_total = pd.concat([df1,df2,df3])
df_total[['name','A','B','C']]
wie alles scheint funktioniert, wenn ich die "groupby" in Kleinbuchstaben "groupby" ändere. Die letzte Funktion funktioniert jedoch nicht: AttributError: Kann nicht auf das aufrufbare Attribut 'isnull' von 'DataFrameGroupBy'-Objekten zugreifen, versuche die Methode' apply 'zu verwenden –
@TrexionKameha: Das bekomme ich für Buchungscode, ohne es vorher auszuführen:). Sie können 'apply' mit der Funktion' pandas.isnull' verwenden, um den gleichen Effekt zu erzielen, siehe Bearbeiten. – spiffman
Um die% NaN zu erhalten, sollten Sie durch die Gesamtanzahl (die Länge) dividieren, nicht die Anzahl der Nicht-Null-Werte, die von 'count' bereitgestellt werden. – Alexander