Ein Datenframe einlesen und einige Spalten umwandeln

Ich möchte mit read_csv in einen Datenrahmen einlesen. Zum Beispiel:Ein Datenframe einlesen und einige Spalten umwandeln

data = pd.read_csv("foo.txt", sep=' ', header=None, dtype={0:np.uint32, 1:np.uint32, 2:np.str})

Außer foo.txt hat die peinliche Eigenschaft, dass die ersten beiden Spalten in Hex sind. Z. B

ff462 44e44 house

Sie können mit int("ff462", 16) einen Hex-Wert in einen int umwandeln. Wie kann ich die Daten einlesen und sicherstellen, dass die ersten beiden Spalten in dtype uint32 konvertiert werden?

Quelle

2016-08-04 eleanora

Sie einen 'converters' Parameter anwenden können, die nimmt ein dict, siehe eine gute Demo auf http://www.gregreda.com/2013/10/26/working-with-pandas-datarefames/ – Jan

@Jan Das sieht gut aus. Kannst du hex direkt in uint32 konvertieren? – eleanora

Sie können in den Daten als String lesen und dann konvertieren ...

data = pd.read_csv("foo.txt", sep=' ', header=None, dtype=str) 
data.iloc[:, [0, 1]] = df.iloc[:, [0, 1]].apply(lambda x: int(x, base=16)).astype(np.uint32)

Quelle

2016-08-04 21:02:44 Alex

Wird das Uint32 machen? – eleanora

Aktualisiert mit einer Art Besetzung – Alex

Vielen Dank. Da die Datei sehr groß ist, würde ich es am liebsten konvertieren, während sie gelesen wird, aber ich werde auch Ihre Lösung versuchen. – eleanora

Offensichtlich funktioniert diese (cf.here):

data['1'] = data.1.apply(lambda x: int(x,base=0)) 
data['1'] = data['1'].astype(np.uint32)

Quelle

2016-08-04 21:02:33 datahero

Wird das Uint32 machen? – eleanora

jetzt sollte es :) – datahero

Ein Datenframe einlesen und einige Spalten umwandeln

Antwort

Verwandte Themen