2017-06-29 1 views
1

Ich habe folgende csv:read_csv Multi Indizierung Datenrahmen

   value value value value ... 
id    1  1  1  2 
indic   1  2  3  1 
valuedate   
05/01/1970 1.0  2.0  3.2  5.2 
06/01/1970 4.1  ... 
07/01/1970   
08/01/1970  

, die ich in einem Pandas Dataframe lesen möchten, so dass ich die folgenden:

df=pd.read_csv("mycsv.csv", skipinitialspace=True, tupleize_cols=True) 

aber die folgende Fehlermeldung erhalten:

Ich vermute, es könnte ein Fehler mit der Multi-Indexierung sein, aber ich verstehe nicht, wie die Parameter von 012 zu verwendenum das zu lösen. (NB: valuedate ist der Name der Indexspalte)

Ich möchte diese Daten in einen DataFrame, der multi-indiziert sein würde: mehrere Indic Sub-Spalten unter der ID-Spalte.

+0

Welches Ergebnis erwarten Sie? –

Antwort

2

file.csv:

   value value value value 
id    1  1  1  2 
indic   1  2  3  1 
valuedate   
05/01/1970 1.0  2.0  3.2  5.2 

Do:

import pandas as pd 

df = pd.read_csv("file.csv", index_cols=0, delim_whitespace=True) 
print(df) 

Ausgang:

  value value.1 value.2 value.3 
id   1.0  1.0  1.0  2.0 
indic   1.0  2.0  3.0  1.0 
valuedate  NaN  NaN  NaN  NaN 
05/01/1970 1.0  2.0  3.2  5.2 
+0

Danke das ist genau was ich will. Aber jetzt gibt Python den folgenden Fehler in einem Fenster aus: 'Python funktioniert nicht mehr. Ein Problem hat dazu geführt, dass das Programm nicht mehr ordnungsgemäß funktioniert. Bitte schließen Sie das Programm. Ich denke, es könnte mit der Größe der CSV (1.326.055 KB) zu tun haben, oder? – Arthurim

Verwandte Themen