Ich versuche, fehlende Daten zu meinem Dataframe hinzuzufügen.Hinzufügen von fehlenden Daten zu Datenrahmen mit Reindex ersetzt Daten
Ich habe diese Beiträge gesehen: reindex und reindex2.
Wenn ich versuche, meinen Datenrahmen indizieren:
print(df)
df = df.reindex(dates, fill_value=0)
print(df)
ich folgende Ausgabe:
_updated_at Name hour day date time data1 data2
06/06/2016 13:27 game_name 13 6 06/06/2016 evening 0 0
07/06/2016 10:33 game_name 10 7 07/06/2016 morning 145.2788 122.7361
18/10/2016 14:34 game_name 14 18 18/10/2016 evening 0 0
19/10/2016 17:12 game_name 17 19 19/10/2016 evening 0 0
24/10/2016 11:05 game_name 11 24 24/10/2016 morning 313.5954 364.4107
24/10/2016 12:02 game_name 12 24 24/10/2016 evening 0 0
25/10/2016 08:50 game_name 8 25 25/10/2016 morning 362.4682 431.5803
25/10/2016 13:00 game_name 13 25 25/10/2016 evening 0 0
_updated_at Name hour day date time data1 data2
24/10/2016 0 0 0 0 0 0 0
25/10/2016 0 0 0 0 0 0 0
26/10/2016 0 0 0 0 0 0 0
27/10/2016 0 0 0 0 0 0 0
28/10/2016 0 0 0 0 0 0 0
29/10/2016 0 0 0 0 0 0 0
30/10/2016 0 0 0 0 0 0 0
Ich erwarte die Zeilen zu sehen, wo ein Datum mit der neuen Zeile gefüllt fehlt und 0en in jedem Wert, anstatt alle Zeilen ersetzt mit 0
EDIT: Das übergeordnete Ziel ist es, in der Lage sein, die Differenz zwischen den Werten zu berechnen, die pro Tag zu einem Morgen- und Abendunterschied führen.
EDIT2: Stromausgang:
print (df.reindex(mux, fill_value=0).groupby(level=0)['data1'].diff(-1).dropna())
dtypes: float64(2)None
2016-06-06 morning 0.00000
2016-06-07 morning 440.99582
2016-06-08 morning 0.00000
2016-06-09 morning 0.00000
2016-06-10 morning 0.00000
print (df.reindex(mux, fill_value=0).groupby(level=0)['data2'].diff(-1).dropna())
Length: 142, dtype: float64
2016-06-06 morning -220.5481
2016-06-07 morning 0.0000
2016-06-08 morning 0.0000
2016-06-09 morning 0.0000
2016-06-10 morning 0.0000
2016-06-11 morning 0.0000
I evening
Werte
gibt es keine Möglichkeit, Duplikate zu ignorieren, wenn reindex mit? – user3939059
Ich denke nicht. Reindex funktioniert mit Duplikaten. – jezrael
leider glaube ich nicht, dass der Mittelwert funktioniert, Sie werden sehen, es gibt eine Spalte namens "Zeit", die angibt, ob es am Morgen oder Abend ist. Ich muss diese Zeilen für Intraday-Berechnungen getrennt halten – user3939059