Angenommen wir folgende Datenrahmen haben:Pandas: Wie resample ich den Datenrahmen so, dass jede Kombination vorhanden ist?
# data
t = pd.to_datetime(pd.Series(['2015-01-01', '2015-02-01', '2015-03-01', '2015-04-01', '2015-01-01', '2015-02-01']))
g = pd.Series(['A', 'A', 'A', 'A', 'B', 'B'])
v = pd.Series([12.1, 14.2, 15.3, 16.2, 12.2, 13.7])
df = pd.DataFrame({'time': t, 'group': g, 'value': v})
# show data
>>> df
time group value
0 2015-01-01 A 12.1
1 2015-02-01 A 14.2
2 2015-03-01 A 15.3
3 2015-04-01 A 16.2
4 2015-01-01 B 12.2
5 2015-02-01 B 13.7
Was ich am Ende haben möchte ist die folgende Datenrahmen:
>>> df
time group value
0 2015-01-01 A 12.1
1 2015-02-01 A 14.2
2 2015-03-01 A 15.3
3 2015-04-01 A 16.2
4 2015-01-01 B 12.2
5 2015-02-01 B 13.7
6 2015-03-01 B 13.7
7 2015-04-01 B 13.7
Die fehlenden Beobachtungen in der Gruppe B
hinzugefügt werden soll, und die Fehlende Werte sollten standardmäßig auf den zuletzt beobachteten Wert gesetzt werden.
Wie kann ich das erreichen? Danke im Voraus!
Dank! Auch für die Bereitstellung von zwei Lösungen. – Michael