Verwenden Sie den folgenden Datenrahmen als ein Beispiel, das unterschiedliche Richtungen für einen Börsentag angibt. Was sind die pythonischsten Ansätze zur Erfassung von Statistiken, die zeigen, welcher Tag am wahrscheinlichsten jeden Tag folgt?Wahrscheinlichkeit des nächsten Tages als spezifische Werte mit Python Pandas
In diesem Beispiel haben wir einfache Tagestypen wie 'Down', 'Up' und 'Flat'.
rng = pd.DataFrame({'day_direction':['Down', 'Down', 'Up', 'Down', 'Up', 'Up', 'Flat', 'Down', 'Down', 'Down', 'Up', 'Up', 'Up','Down',]},
index = pd.date_range('4/2/2014', periods=14, freq='D'))
rng
Wunsch Ausgabe wird in etwa so aussehen:
day_direction Next_day
Down Down 60%
Up 15%
Flat 35%
Up Up 55%
Flat 15%
Down 30%
Flat Flat 20%
Down 20%
Up 60%
Könnte dies mit einem groupby oder ähnlichem erreicht werden? Wäre toll, mögliche Lösungen dafür zu sehen.
Das sieht sehr gut dank ysearka. Ich bekomme jedoch einen 'KeyError: 'N'' mit der zweiten Lösung. – ade1e
Mein Fehler, ich habe den ersten Teil dieses Codes vergessen. Die Idee ist, eine andere Spalte von rng mit der Bezeichnung "N" zu summieren, anstatt "size" zu verwenden, um den Index zu behalten. Ich habe meine Antwort bearbeitet. – ysearka
Danke ysearka das ist sehr netter Code. Gibt es eine Chance, dass Sie dies in eine Funktion stellen können, damit es für andere Daten verwendet werden kann? Markierung als akzeptiert, wäre aber toll, um die Funktion zu sehen. – ade1e