Ich habe mit Parametern von read_csv von Panda verwechselt.Python panda read_csv: Können wir STRING in einer Zeile auf NUMPY laden?
Ich möchte einen Klassifikator mit Support Vector Machines machen. Um den Klassifikator zu verwenden, müssen beide Vektoren X und Y numerisch sein. Ich habe eine CSV-Datei, in der es zwei Spalten:
die erste Spalte eine Zahl (Ziel), zum Beispiel 1 oder 0
In der zweiten Spalte ist ein Vektor (Merkmal) mit "" seperator, beispielsweise 12 32 63 73 563 34.
Das Problem, das ich in lief:
Werte aus der ersten Spalte werden geladen als 'numpy.int32'
Werte aus der zweiten Spalte werden als 'str' geladen, während ich will, dass sie numpy Arrays sind.
import pandas as pd import numpy as np DF = pd.read_csv("C:\\STUFF\\foo.csv") df = DF.head(2) X = df["firstcol"] target = X.values for i in target: print (type(i)) Y = df["secondcol"] feature = Y.values for j in feature: print (type(j))
So ist der Ausgang
<class 'numpy.int64'>
<class 'numpy.int64'>
<class 'str'>
<class 'str'>
Die Frage ist: Was ist die schnellste und angemessene Weise zweite Kolonne in numpy zu verwandeln?
thx. funktioniert für mich –