Okay, ich kann nicht scheinen, die Lösung zu finden, so hier ist meine Frage. Ich würde es sehr begrüßen, wenn jemand aus der stackoverflow-Community bald eine Lösung vorschlagen könnte, da ich die Ergebnisse einreichen muss.Verketten Zwei CSV-Dateien oder Datenrahmen unter einer bestimmten Bedingung
Ich habe zwei csv-Dateien (kann als Datenframes geladen werden). Eine CSV-Datei enthält 1458644 Zeilen und 12 Spalten mit allen Zeileneinträgen, die Ereignisse für die Dauer von 6 Monaten bis zu den Sekunden von mehreren Tagen angeben.
Die andere CSV-Datei mit den Wetterdaten hat 4432 Einträge, mit den Wetterdaten eines jeden Tages mit der Stunde angegeben (nicht hier Sekunden Dauer) von 6 Monaten
Was will ich die Einträge tun kombinieren beide Dateien unter Verwendung einer Python-Operation (oder verketten mit der Bedingung), so dass die Daten aus dem Stundeneintrag des zweiten Datenrahmens zu dem ersten Datenrahmen hinzugefügt werden, die Einträge für eine einzelne Stunde (spezifiziert in dem zweiten Datenrahmen) dupliziert und wiederholt werden die einzelne Stunde des ersten Datenrahmens
z
Erste Datenrahmen
Date: col1, cl2,
1/2/2013 12:05:00 yyy etc.
1/2/2013 12:12:00 yyy
1/2/2013 13:13:00 yyy
1/2/2013 14:14:00 yyy
1/2/2013 14:30:00 yyy
1/2/2013 14:45:00 yyy
1/2/2013 17:00:00 yyy
1/2/2013 17:17:00 yyy
1/2/2013 17:30:00 yyy
1/2/2013 18:17:00 yyy
1/2/2013 18:30:00 yyy
2. Datenrahmen
Date col3 col4
1/2/2013 12:00:00 xxx overcast
1/2/2013 13:00:00 xxx overcast
1/2/2013 14:00:00 xxx sunny
1/2/2013 15:00:00 xxx sunny
1/2/2013 16:00:00 xxx rain
1/2/2013 17:00:00 xxx rain
1/2/2013 18:00:00 xxx cloudy
Das Endergebnis wie folgt aussehen sollte:
Date: col1, col2, col3, col4
1/2/2013 12:05:00 yyy etc. xxx overcast
1/2/2013 12:12:00 yyy xxx overcast
1/2/2013 13:13:00 yyy xxx overcast
1/2/2013 14:14:00 yyy xxx sunny
1/2/2013 14:30:00 yyy xxx sunny
1/2/2013 14:45:00 yyy xxx sunny
1/2/2013 17:00:00 yyy xxx rain
1/2/2013 17:17:00 yyy xxx rain
1/2/2013 17:30:00 yyy xxx rain
1/2/2013 18:17:00 yyy xxx cloudy
1/2/2013 18:30:00 yyy xxx cloudy
Also für jeden Datensatz/Zeile in frame1 Sie die gleiche Stunde in frame2 nachzuschlagen, und seine colunms ? Und es gibt eine variable Anzahl von Übereinstimmungen zwischen 1 und 2. – hpaulj