ich eine CSV-Datei, die Pandas lesen csv mit mehreren Leerzeichen und analysieren Daten
Year Mo Da (01,52)
1950 1 1 0.00
1950 1 2 0.00
1950 1 3 0.05
1950 1 4 0.00
1950 1 5 0.07
1950 1 6 0.07
wie
aussieht und ich würde es in einen Datenrahmen mit 2 Spalten wie Transformation: eine Datetime-Spalte von YYYYMMDD (mit dem „Jahr Spalten "," Mo "und" Da "in den Rohdaten) und dann der Niederschlag am Rasterpunkt (z. B. 01, 52) als zweite Spalte.Eine gewünschte Ausgabe wäre:
Datetime Rainfall
19500101 0.00
19500102 0.00
19500103 0.05
ich auf zwei Fragen steckte: in geeignete Weise während der Lese-in für die Leer Buchhaltung und richtig parse_dates
verwenden.
Die einfache Lese-Kommando:
df = pd.read_csv(csv_fl)
Fast richtig in den Header liest, sondern teilt den (01,52) in separaten Spalten, eine Hinter NaN nachgebend, die nicht da sein sollte. Jede Führung ist sehr geschätzt unter Verwendung
df = pd.read_csv(csv_fl, parse_dates={'Datetime':[0,1,2]}, index_col=0)
führt zu einem Indexerror
colnames.append(str(columns[c]))
IndexError: list index out of range
Year Mo Da (01 52)
0 1950 1 1 0.00 NaN
und zu versuchen, die Daten zu analysieren.
Großartig, danke. Ich werde die Antwort akzeptieren, wenn erlaubt. – N1B4