2016-07-08 14 views
0

Ich bin noch neu bei Python und Pandas und versuche immer noch zu lernen. Versuche, Pandas für ein komplexes Szenario zu verwenden. unten ist eine kleine Probe meines DatenrahmenVergleichen verschiedener Spaltenwerte bei verschiedenen Zeilennummern eines Datenrahmens

In [9]: df 
Out[9]: 
     TXN_KEY Send_Agent Pay_Agent  Send_Customer /
0  13272184 AWD120279 AEU002152 1000000000021979638 
1  13272947 ARA030122 AWD120279 1000000000030604143 
2  13273453 API185805 API190139 2000000000096483346 
3  13273870 ANO080012 API352676 1000000000046574257 
4  13274676 AUK359401 API185805 1000000000082052557 
5  13274871 ACL000105 ACB020203 1000000000082187111 


    Pay_Customer   Send_Time   Pay_Time 
0  1000000000081805876 2012-05-22 09:45:00 2012-05-31 02:50:00 
1  1000000000021979638 2012-05-31 08:09:00 2012-05-31 09:52:00 
2  2000000000241863019 2012-05-30 04:18:00 2012-05-30 23:42:00 
3  2000000000080690692 2012-05-31 02:25:00 2012-05-31 21:43:00 
4  2000000000096483346 2012-05-31 11:25:00 2012-05-31 11:57:00 
5  1000000000301277732 2012-05-31 13:07:00 2012-05-31 17:36:00 

Send_Customer sendet Geld, um ein Sendemittel an einen Pay_Agent mit dem Pay_Customer dem Geld erhält.

Jeder Agent kann sowohl ein Sendeagent als auch ein Bezahlagent sein.

Für alle Agenten möchte ich die Anzahl derjenigen Kunden zählen, die innerhalb von 10 Stunden Geld senden und erhalten.

Zum Beispiel im obigen Beispiel: Kunde 1000000000021979638 sendet Geld mit Agent AWD120279 und in weniger als 10 Stunden erhält es Geld bei dem gleichen Agenten AWD120279.

Dasselbe für Kunde 2000000000096483346 bei Agent API185805.

Also die Anzahl für AWD120279 und API185805 ist 1 für dieses Szenario.

Ich kann mir nicht vorstellen, wie ich mich einem solchen Szenario annähern soll. Danke im Voraus.

Antwort

0

Das Teilen des Datenrahmens von Sendeseite und Pay-Seite und das Ausführen innerer Joins gab mir die gewünschte Ausgabe.

Verwandte Themen