Sampling-Sequenzen in Pandas

2017-02-01 3 views 0 likes

Ich habe eine Reihe von sequentiellen Daten, und ich möchte mit dem Austausch, zufällige Sequenzen von Elementen (z. B. 50 Tage zu einer Zeit).Sampling-Sequenzen in Pandas

Wenn ich etwas wie df.sample(50,replace=True) mache, zieht es nur 50 zufällige Reihen aus einem Hut.

Ich habe Code geschrieben, der den Trick tut, aber es ist nicht nett. Gibt es einen Standard Weg, dies in Pandas zu tun?

Quelle

2017-02-01 cjm2671

'Ich habe Code geschrieben, der den Trick macht, aber es ist nicht nett. - Sie können uns eine vereinfachte - nicht so nette Implementierung Ihres Codes zeigen. – cel

Antwort

Würde so etwas funktionieren?

df.loc[np.random.choice(df.where((df.date >= 1/1/16) & (df.date <= 3/15/16)) , 50, replace=True)]

Quelle

2017-02-01 18:06:58

Unter der Annahme, python2.7, indiziert Ihre Datenrahmen zu Terminen, zu sortieren und dann können Sie Zeilen auswählen sehr schön, wie so:

my_df.iloc(xrange(10, 60))

Offensichtlich sorgen für das zweite Argument xrange < my_df.shape[0]. Es ist einfach, den ausgewählten Bereich zu randomisieren.

Quelle

2017-02-01 18:18:44 rtkaleta

Verwandte Themen

1. in Pandas
2. Pandas - Äquivalent str.contains() in Pandas Abfrage
3. Importieren eine CSV-Datei in Pandas in einen Pandas Datenrahmen
4. Bedingte Ersatz in Pandas
5. Slicing Series in Pandas
6. Datumsbereiche in Pandas
7. Strings in Pandas verbinden
8. sort_values () Methode in Pandas
9. Beschriftungsdaten in Pandas
10. 'Inverse' cumprod in Pandas
11. Pandas in Python importieren
12. Vektorisierungsberechnungen in Pandas
13. Dauer Sekunden in Pandas
14. Pandas: Syntax in GROUPBY
15. Anfügen Datenrahmen in Pandas
16. Annualisierte Rendite in Pandas
17. Parsing Spaltenwerte in Pandas
18. Seltsame Datenmanipulation in Pandas
19. Umkehren Namen in Pandas
20. loc Funktion in Pandas
21. Farbnummern in Pandas Datenrahmen
22. Vertausche Gruppen in Pandas
23. Relative Zeilenauswahl in Pandas?
24. von Filterergebnisse in Pandas
25. KeyError in Pandas
26. Parsing CSV in Pandas
27. Geschichtete Sampling in Pandas
28. Pandas: Trennzeichen in DataFrame.from_dict()
29. Effiziente Kettenzusammenführung in Pandas
30. Datenrahmen in Pandas verschmelzen