2016-03-25 6 views
0

würde ich mein Skript wie folgendes zu tun:Wie benutze ich Python Web Scraping, um eine CSV-Datei herunterzuladen und in Pandas Dataframe umzuwandeln?

1) Zugriff auf diese website:
2) Importieren einer CSV-Datei mit dem Titel „Verkaufsdaten mit Leading Indicator“
3) wandeln es in Pandas Datenrahmen für Daten Analyse.

Derzeit ist der Code, den ich habe, ist dies:

response = request.urlopen("http://vincentarelbundock.github.io/Rdatasets/datasets.html") 
csv = response.read() 

Vielen Dank im Voraus

Antwort

3

pandas.read_csv() Methode eine URL in eine CSV-Datei als Puffer akzeptiert, so

import pandas as pd 
pd.read_csv('http://vincentarelbundock.github.io/Rdatasets/csv/datasets/BJsales.csv') 

im Grunde sollte Arbeit. Siehe weitere Informationen here.

+0

Vielen Dank. Ich habe 2 zusätzliche Fragen. Woher wussten Sie, HTML-Erweiterung zu entfernen und Datensatz-Titel und CSV hinzufügen? Zweitens, warum funktioniert die Methode nicht für den Datensatz "Guerry" oder gar "Forbes"? – MLhacker

+0

Die Website, die Sie in Ihrer Frage verlinkt haben, ist keine CSV-Datei, sondern enthält nur Links zu CSV-Dateien. Verkaufsdaten mit Leading Indicator "Datei, so habe ich nur seine URL verwendet, nichts Schickes. – DeepSpace

Verwandte Themen