2016-05-09 7 views
1

Ich bekomme den folgenden Fehler beim Laden von Daten in einen Datenrahmen und automatische Konvertierung in kategoriale Variablen.Wie lade ich kategoriale Variable mit Pandas read_csv?

df = pd.read_csv(filepath_or_buffer=filename, 
       header=0, 
       index_col=False, 
       usecols=['col1', 'col2', 'col3'], 
       dtype={'col1': int, 
         'col2': 'category', 
         'col3': float}) 

TypeError: data type "category" not understood

Antwort

1

zur Zeit ist es nicht implementiert, aber Sie können die folgende Abhilfe verwenden:

dtype={'col1': int, 
     'col2': pd.CategoricalDtype(['cat1', 'cat2', 'cat3']), 
     'col3': float} 

here ist noch offen Feature-Anfrage

2

Die einfachste Sache zu tun ist zu konvertieren zu einem kategorischen nach der Tat, besonders in Anbetracht dessen, dass Sie möglicherweise nicht alle gültigen Kategorien bis nach yo wissen Du liest die Datei.

df = pd.read_csv(filepath_or_buffer=filename, usecols=['col1', 'col2', 'col3']) 
df['col3'] = df.col3.astype('category') 
Verwandte Themen