[Ich bin neu in R ...] Ich habe diese dataframe:R convert Zusammenfassung Ergebnis (Statistiken mit allen Datenrahmen Spalten) in Datenrahmen
df1 <- data.frame(c(2,1,2), c(1,2,3,4,5,6), seq(141,170)) #create data.frame
names(df1) <- c('gender', 'age', 'height') #column names
Ich mag die df1
‚s Zusammenfassung in einem Datenrahmen Objekt das sieht wie folgt aus:
count mean std min 25% 50% 75% max
age 30.0000 3.5000 1.7370 1.0000 2.0000 3.5000 5.0000 6.0000
gender 30.0000 1.6667 0.4795 1.0000 1.0000 2.0000 2.0000 2.0000
height 30.0000 155.5000 8.8034 141.0000 148.2500 155.5000 162.7500 170.0000
ich dies in Python mit df1.describe().T
generiert haben. Wie kann ich das in R machen?
Es wäre kostenlos, wenn mein zusammenfassendes Datenformat würde die "dtype", "null" (Anzahl der NULL
Werte), (Anzahl von) "Unique" und "Range" -Werte sowie eine umfassende Zusammenfassung Statistiken enthalten :
count mean std min 25% 50% 75% max null unique range dtype
age 30.0000 3.5000 1.7370 1.0000 2.0000 3.5000 5.0000 6.0000 0 6 5 int64
gender 30.0000 1.6667 0.4795 1.0000 1.0000 2.0000 2.0000 2.0000 0 2 1 int64
height 30.0000 155.5000 8.8034 141.0000 148.2500 155.5000 162.7500 170.0000 0 30 29 int64
der Python-Code von oben Ergebnis ist:
df1.describe().T.join(pd.DataFrame(df1.isnull().sum(), columns=['null']))\
.join(pd.DataFrame.from_dict({i:df1[i].nunique() for i in df1.columns}, orient='index')\
.rename(columns={0:'unique'}))\
.join(pd.DataFrame.from_dict({i:(df1[i].max() - df1[i].min()) for i in df1.columns}, orient='index')\
.rename(columns={0:'range'}))\
.join(pd.DataFrame(df1.dtypes, columns=['dtype']))
Thank you!
Vielen Dank, es funktioniert perfekt! – ragesz
Ich habe die anderen nützlichen statistischen Funktionen zu Ihrer Lösung hinzugefügt – ragesz
Danke, es gab einen kleinen Fehler (wahrscheinlich Zwischenversion) Ich korrigierte Sie bearbeiten Vorschlag, es ist in Ordnung. – agenis