Ich habe ein Datenframe mit Spalten: Benutzer, Betrag_spend, Monat, Tag, Stunde Ich versuche, meine Daten in Training und Testdaten zu teilen; Ich möchte die erste Ladung bis zu 365 Tage bekommen * 80% Ich bin mir nicht sicher, wie ich das machen soll. Ich habe einen Jahresumsatz Datenrahmen, die eine Zusammenfassung der Verkäufe auf jeden Benutzer basierend enthält:Splitdaten in 80% von 365 Tagen von der ersten Ladung in Training und Test
f1 = {'year': ['min', 'max'], 'amount_spent':['sum','mean', 'count','max']}
yearly_sales = df.groupby('user')['year', 'amount_spent'].agg(f1).reset_index()
yearly_sales.columns = ['user', 'sum', 'mean', 'count', 'high', 'before', 'after']
yearly_sales['duration'] = (yearly_sales.after - yearly_sales.before) + 1
Ich bin neu in diesem so, wenn mir jemand diese Spalte erstellen helfen könnte? Danke!