2017-12-14 2 views
0

Ich versuche, eine CSV-Datei in Jupyter Notebook mit Panadas zu lesen. Wenn ich die Datei und Index die Spalten lesen, erhalte ich eine Nachricht, dieKann mir jemand helfen zu verstehen, warum mein CSV als HTML-Doctype gelesen wird?

Index ([‘< '! DOCTYPE HTML>'], dtype = 'Objekt') liest

Ich bin Unklar, warum meine Datei als HTML-Doctype gelesen wird und ich keine der Spalten im aktuellen Format lesen kann. Ich bekomme auch Fehler, wenn ich die Datei in Excel umwandeln. Kann mir jemand in die richtige Richtung weisen, was das Problem sein könnte? Vielen Dank.

import numpy as np 
import pandas as pd 

inspection = pd.read_csv("http://localhost:8889/view/Desktop/python/Data/Inspections_MergedFile.csv", sep='\t') 

inspection.columns 

Die CSV-Daten aus NYC Open-Datendatei auf Restaurant-Inspektion genommen wird: https://data.cityofnewyork.us/Health/DOHMH-New-York-City-Restaurant-Inspection-Results/xx67-kt59, die mit 311 die Daten auf Lebensmittelvergiftung https://data.cityofnewyork.us/Social-Services/food-poisoning/gjkf-etq5 verbunden war.

+1

Können Sie eine Probe aus Ihrem CSV einfügen? – user1721713

+1

Ich sehe eine "Export" -Schaltfläche auf dieser Webseite und wenn Sie darauf klicken, sehen Sie eine "CSV" -Schaltfläche. Ich schätze, das ist NICHT, was Sie getan haben ... – JohnE

Antwort

1

Wenn Sie versuchen, die Datei lokal über eine Web-API-Route bereitzustellen, müssen Sie weitere Informationen zu Ihrer App und zu den von Ihnen erstellten Konstruktionen angeben.

Wenn ich versuche, die den folgenden Link aus Ihnen zur Verfügung gestellten und kopieren Sie den Link für die Exportoptionen für das CSV-Format erhalte ich die heruntergeladenen Daten (schließlich nach einigen Minuten), wenn auch mit einer Warnung ...

>>> df = pandas.read_csv('https://data.cityofnewyork.us/api/views/xx67-kt59/rows.csv') 
sys:1: DtypeWarning: Columns (6) have mixed types. Specify dtype option on import or set low_memory=False. 
>>> df 
      CAMIS        DBA   BORO BUILDING \ 
0  41471806      THE HEN HOUSE  BROOKLYN  7302 
1  50060020     CURRY EXPRESS NY  MANHATTAN  130 
2  50060627   RED HOUSE ASIAN FUSION   QUEENS 19203 
3  50040866      FUEL GRILL  MANHATTAN  112 
4  41710571      BLACKTHORN 51   QUEENS  8012 
5  50015486      THE IZAKAYA  MANHATTAN  326 
6  50015250    PETITE BLUE DOG CAFE  MANHATTAN  119 
7  40388091       MASAWA  MANHATTAN  1239 
8  41456998      A.I.G.CHARTIS  MANHATTAN  175 
9  50006741      GRACE CAFE  MANHATTAN  572 
10  41377069    CATALDO'S RESTAURANT  BROOKLYN  554 
11  41145911     WA LUNG KITCHEN  MANHATTAN  557 
12  41547536    MINT'S THAI KITCHEN   QUEENS  7015 
13  41066771     DUNKIN' DONUTS  BROOKLYN  5702 
14  40365472   SPAIN RESTAURANT & BAR  MANHATTAN  113 
15  50072117        NaN  MANHATTAN  307 
16  50042671      EDGAR'S CAFE  MANHATTAN  650 
17  41490991     LIPS RESTAURANT  MANHATTAN  227 
18  41713624 BIENVENIDOS AL CALLAO RESTAURANT   QUEENS 11122 
19  40923012       DOMINO'S  MANHATTAN  200 
20  41477406     CIBAO RESTAURANT   QUEENS 10422 
21  50013522    BREWKLYN GRIND COFFEE  BROOKLYN  557 
22  41212364       BECKETT'S  MANHATTAN  81 
23  50066646     TOKOYO EXPRESS   QUEENS  7057 
24  41575815     BLACKOUT LOUNGE   QUEENS 13316 
... 
+0

Vielen Dank für Ihre Hilfe. Ich benutze die Datei nicht über eine API. Ich habe die CSV-Datei lokal auf meinem Computer gespeichert und ich versuche, die Datei aus diesem Ordner in Juypter Notebook zu lesen. – Lenny

+0

Sie können dann wahrscheinlich einen direkten Pfad zu der Datei angeben, zB 'df = pd.read_csv (" C: \ Temp \ MeinFeld \ myData.csv "), oder' df = 'pd.read_csv (" ./ RelativerFolder/myData.csv ")', etc. – jxramos

+0

Großartig, es ist gut zu wissen, was passiert ist, wenn Sie es eine HTTP-Zeichenfolge geben Pandas tauscht Modi, um eine Datei mit Urllib und andere Sachen zu starten, um die Arbeit zu erledigen. Aber das ist nicht nötig, wenn die Datei lokal ist. – jxramos

Verwandte Themen