Ich habe einen Datensatz, wie unten aussieht:bestimmte Zeilenwerte auswählen und sie Spalten in Pandas machen
+-------------------------+-------------+------+--------+-------------+--------+--+
| | impressions | name | shares | video_views | diff | |
+-------------------------+-------------+------+--------+-------------+--------+--+
| _ts | | | | | | |
| 2016-09-12 23:15:04.120 | 1 | Vidz | 7 | 10318 | 15mins | |
| 2016-09-12 23:16:45.869 | 2 | Vidz | 7 | 10318 | 16mins | |
| 2016-09-12 23:30:03.129 | 3 | Vidz | 18 | 29291 | 30mins | |
| 2016-09-12 23:32:08.317 | 4 | Vidz | 18 | 29291 | 32mins | |
+-------------------------+-------------+------+--------+-------------+--------+--+
ich einen Datenrahmen zu bauen, ich versuche zu einem Regressionsmodell zu ernähren, und ich möchte Analysieren bestimmter Zeilen als Features. Um dies zu tun, möchte ich den Datenrahmen zu diesem ähneln
+-------------------------+------+--------------+-------------------+-------------------+--------------+-------------------+-------------------+
| | name | 15min_shares | 15min_impressions | 15min_video_views | 30min_shares | 30min_impressions | 30min_video_views |
+-------------------------+------+--------------+-------------------+-------------------+--------------+-------------------+-------------------+
| _ts | | | | | | | |
| 2016-09-12 23:15:04.120 | Vidz | 7 | 1 | 10318 | 18 | 3 | 29291 |
+-------------------------+------+--------------+-------------------+-------------------+--------------+-------------------+-------------------+
Was wäre der beste Weg, dies zu tun? Ich denke, das wäre einfacher, wenn ich nur eine Reihe (15 Minuten) auswählen würde, einfach die unnötigen Reihen analysieren und drehen.
Ich brauche aber 15min und 30min Funktionen und bin nicht sicher, wie man für diese Spalten von der Notwendigkeit gehen
Haben Sie jetzt über [ 'pandas.DataFrame.get_dummies()'] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.get_dummies.html), es ist nicht genau das, wonach Sie gefragt haben, aber es könnte ein Workaround sein. – quapka
Die gewünschte Ausgabe ist nicht sinnvoll. Ihre _ts-Zeile mit 2016-09-12 23: 15: 04.120 hat keine 30-Minuten-Impressionen. –