2016-06-14 9 views
0

Ich habe zwei Datenrahmen, die über den gleichen Zeitraum erstrecktpandas und Resampling im Vergleich zum Len eines anderen Datenrahmen

"2016-05-13" to "2016-05-19" 

dfone und dftwo

dfone Länge 29542 dftwo Länge 11637

Ich würde gerne die Corrcoef ausmachen, aber ich brauche die Länge der beiden, um gleich zu sein. Gibt es irgendeine Art und Weise wie

dfone.resample(len(dftwo)).mean()

edit:

Die Termine wie folgt aussehen:

2016-06-10 20:15:00+02:00  
2016-06-10 20:16:00+02:00 
2016-06-10 20:17:00+02:00 
2016-06-10 20:18:00+02:00 
2016-06-10 20:19:00+02:00 

Es gibt Duplikate unter den Daten der zwei Datenrahmen. Aber sie können nicht genau zur gleichen Zeit beginnen und enden.

+1

Es gibt datetimeindex mit 'dates' nur oder mit' Time' auch? Ist es möglich, beide Daten auf gleiche Länge zu resampeln, aber anders als "dfone" und "dftwo"? – jezrael

+0

Sind Duplikate in "Datum" -Werten vorhanden? – jezrael

+0

@jezrael Ich habe meine Frage mit Antworten aktualisiert – vandelay

Antwort

0

Ich glaube, Sie können zuerst resample von minutes (weil keine Sekunde in der Probe) und dann join:

print (dfone) 
        col 
2016-06-10 18:16:00 1 
2016-06-10 18:16:00 3 
2016-06-10 18:17:00 4 
2016-06-10 18:17:00 1 
2016-06-10 18:17:00 4 
2016-06-10 18:18:00 1 
2016-06-10 18:19:00 8 

print (dftwo) 
        col1 
2016-06-10 18:16:00  1 
2016-06-10 18:16:00  3 
2016-06-10 18:17:00  4 
2016-06-10 18:18:00  1 
2016-06-10 18:19:00  8 

print (dfone.resample('1Min').mean()) 
        col 
2016-06-10 18:16:00 2 
2016-06-10 18:17:00 3 
2016-06-10 18:18:00 1 
2016-06-10 18:19:00 8 

print (dftwo.join(dfone.resample('1Min').mean())) 
        col1 col 
2016-06-10 18:16:00  1 2 
2016-06-10 18:16:00  3 2 
2016-06-10 18:17:00  4 3 
2016-06-10 18:18:00  1 1 
2016-06-10 18:19:00  8 8 
Verwandte Themen