Ich importiere eine csv-Datei mit csv.reader und pandas. Die Anzahl der Zeilen aus derselben Datei ist jedoch unterschiedlich.unterschied in csv.reader und pandas - python
reviews = []
openfile = open("reviews.csv", 'rb')
r = csv.reader(openfile)
for i in r:
reviews.append(i)
openfile.close()
print len(reviews)
das Ergebnis ist 10.000 (was der richtige Wert ist). Pandas gibt jedoch einen anderen Wert zurück.
df = pd.read_csv("reviews.csv", header=None)
df.info()
diese kehrt 9985
Weiß jemand, warum Unterschied zwischen den beiden Methoden gibt es Daten zu importieren?
ich das gerade versucht:
reviews_df = pd.DataFrame(reviews)
reviews_df.info()
Das gibt 10.000.
Ich kann dieses Problem nicht reproduzieren. Wenn ich diesen Code auf einer 'csv' Datei laufe, ist der Unterschied nur eine Zeile und das ist der' header' –
Kannst du uns eine kleine Beispieldatei geben, die das Problem demonstriert? Dies sollte möglich sein, wenn Sie zuerst herausfinden, welche * Zeilen fehlen. –
Das soll sein. Ich habe dieses Problem noch nie zuvor gesehen. – kevin