Versuch csv Datei in Pandas Datenrahmen mit der folgenden FormatierungSpaltentypen einstellen, während sie mit Pandas Lesen csv
dp = pd.read_csv('products.csv', header = 0, dtype = {'name': str,'review': str,
'rating': int,'word_count': dict}, engine = 'c')
print dp.shape
for col in dp.columns:
print 'column', col,':', type(col[0])
print type(dp['rating'][0])
dp.head(3)
Dies ist die Ausgabe zu lesen:
(183531, 4)
column name : <type 'str'>
column review : <type 'str'>
column rating : <type 'str'>
column word_count : <type 'str'>
<type 'numpy.int64'>
Ich kann Art zu verstehen, dass Pandas möglicherweise finden Sie es schwierig, eine String-Darstellung eines Wörterbuchs in ein Wörterbuch gegebenen this und this zu konvertieren. Aber wie kann der Inhalt der "Rating" -Spalte str und numpy.int64 sein ???
Übrigens, Tweaks wie keine Engine oder Header festlegen nichts ändern.
Danke und Grüße
Danke, das war ein Zettel meinerseits :) Ich wähle dies als die akzeptierte Antwort, weil es eine direkte Antwort auf meine Frage ist. – user2738815
Ich vermute, es war ein Tippfehler, manchmal schwer zu erkennen, wenn man sich auf den Code konzentrierte;) –