Angenommen, ich eine Datenrahmen haben, wie folgt,Looping durch vorherigen oder nächsten Zeilen und tun Berechnung - Python
ID response time
1 1315 1.434054
2 1682 3.753334
2 2829 5.940094
3 184 6.243214
4 243 6.301918
3 1413 7.486633
5 2400 11.474644
6 2151 3.288531
der Datenrahmen hat eine ID, Antwort und Zeit.
Für Beispiele, die keine Duplikate in ID (1,4,5,6) haben, möchte ich die Zeit zurückgeben. Für Beispiele, die Duplikate in ID (2,3) haben, möchte ich das Minimum der zwei Zeiten in der Spalte min_time und den Unterschied zwischen den beiden Zeiten in der Differenzspalte zurückgeben. Im Folgenden ist der Ausgang ich bin auf der Suche,
ID response time min_time difference
1 1315 1.434054 1.434054 NA
2 1682 3.753334 3.753334 2.18676
2 2829 5.940094 3.753334 2.18676
3 184 6.243214 6.243214 1.243419
4 243 6.301918 6.301918 NA
3 1413 7.486633 6.243214 1.243419
5 2400 11.474644 11.474644 NA
6 2151 3.288531 3.288531 NA
Während ich in der Lage bin diese Ausgabe zu bringen Schleifen verwendet wird, ist es nicht die beste effiziente Art und Weise, es zu tun, und es dauert auch viel Zeit. Gibt es einen besseren Weg, dies zu tun?
Vielleicht kann dies helfen: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html – moooeeeep