Ich habe einen CSV-Datensatz, der wie folgt aussieht:Importieren von CSV in Python
FirstAge,SecondAge,FirstCountry,SecondCountry,Income,NAME
41,41,USA,UK,113764,John
53,43,USA,USA,145963,Fred
47,37,USA,UK,42857,Dan
47,44,UK,USA,95352,Mark
Ich versuche zu laden Sie es in Python 3.6 mit diesem Code:
>>> from numpy import genfromtxt
>>> my_data = genfromtxt('first.csv', delimiter=',')
>>> print(train_data)
Ausgang:
[[ nan nan nan nan
nan nan]
[ 4.10000000e+01 4.10000000e+01 nan nan
1.13764000e+05 nan]
[ 5.30000000e+01 4.30000000e+01 nan nan
1.45963000e+05 nan]
...,
[ 2.10000000e+01 3.00000000e+01 nan nan
1.19929000e+05 nan]
[ 6.90000000e+01 6.40000000e+01 nan nan
1.52667000e+05 nan]
[ 2.00000000e+01 1.90000000e+01 nan nan
1.05077000e+05 nan]]
Ich habe mir die Numpy Docs angeschaut und ich sehe nichts darüber.
Ist 'USA' oder' UK' eine Zahl?! Was ist das Problem, vor dem du stehst? –
Das Problem, in das Sie möglicherweise geraten, ist das numpy, das Ihre Daten als numerischen Typ analysieren soll, und das könnte unerwartetes Verhalten verursachen. – AgnosticDev
Die numerischen Spalten/Zeilen sind richtig, nur im Float. Die "Nan" stehen für Strings, die nicht als Floats interpretiert werden können. – hpaulj