Pandas: Anzeige groupby Aggregat Statistik mit Daten

Data Snippet Pandas: Anzeige groupby Aggregat Statistik mit Daten

Ich versuche, eine neue Spalte zu meinem Datenrahmen hinzuzufügen, die den durchschnittlichen Kaufbetrag pro Benutzer anzeigt. Der Datenrahmen heißt trainDf und die untere Zeile des Codes erzeugt den Durchschnittswert nach Benutzer. Ich versuche zu lernen, wie man es als eine Spalte hinzufügt, um ähnlich dem obigen Bild anzuzeigen.

AveragePurchaseAmountUser = trainDf.groupby(by='User_ID')['Purchase_Amount'].mean()

Vielen Dank im Voraus!

Quelle

2017-12-05 Kyle

können Sie versuchen:

trainDf['AveragePurchaseAmountUser'] = trainDf.groupby(['User_ID'])['Purchase_Amount'].mean()

Quelle

2017-12-05 15:27:36

Dies wird die 'AveragePurchaseAmountUser'-Spalte mit NaNs füllen, wie Pandas nicht Passen Sie die Reihe standardmäßig an die Datenrahmenspaltenwerte an. – Tim

Bestätigt. Füllsäule mit NaNs – Kyle

I Dieses merge

avg_df = trainDf.groupby(by='User_ID')['Purchase_Amount'].mean().reset_index().rename(columns={'Purchase_Amount': 'Avg'}) 
trainDf = trainDf.merge(avg_df, on='User_ID')

Quelle

2017-12-05 15:41:32 EyJay

Das hat auch funktioniert! Danke – Kyle

kehrt die Datenrahmen mit der neuen Spalte

def avg(df): 
    df['Average_Purchase_Amount'] = df['Purchase_Amount'].mean() 
    return df 

newDf = trainDf.groupby(by='User_ID').apply(avg)

verwenden würde Und wenn Sie die Spalte als ein Serie können Sie diese Funktion anwenden:

def avgSeries(df): 
    return pd.Series(data = df['Purchase_Amount'].mean(), index = df.index)

dann die Spalte später Datenrahmen hinzufügen

Quelle

2017-12-05 15:42:45 susitsm

Das hat funktioniert! Danke – Kyle

Dies ist, was transform ist für

AveragePurchaseAmountUser = trainDf.groupby(by='User_ID')['Purchase_Amount'].transform() .mean()

ich nicht atm testen können, aber Sie könnten

...transform('mean')

Stattdessen müssen

Quelle

2017-12-05 15:52:22

Wenn ich diese Linie laufen lasse, produziert es den folgenden Fehler: AttributeError: "Funktion" Gegenstand hat kein Attribut "Durchschnitt" – Kyle

Ich habe Klammern vergessen –

Pandas: Anzeige groupby Aggregat Statistik mit Daten

Antwort

Verwandte Themen