2017-09-09 2 views
-1

Also ich bin neu zu Pandas und ich versuche, einige Daten von einer Webseite in mein Jupyter-Notizbuch zu importieren, aber wenn ich es importiere, sind das Attribut und die Daten nicht richtig ausgerichtet, und ich kann keine Operationen darauf ausführen. Wie behebe ich es, so dass die Spaltenüberschrift und die Daten in der gleichen Spalte sind? weil es in diesem Format ich kann die Daten nicht manipulieren.Laden einer CSV-Datei in einen Pandas-Datenrahmen

dies ist der Link i https://www.stat.berkeley.edu/~statlabs/data/babies.data

+0

Wenn Ihre Frage ausreichend beantwortet wurde, bitte [akzeptieren] (https://stackoverflow.com/help/someone-answers) eine Antwort. Sie erhalten auch Reputation aus der Annahme von Antworten. Klicken Sie auf das graue Häkchen neben einer Antwort, bis es grün wird. –

Antwort

0

Ihre Datei Leerzeichen begrenzt zu sein scheint zu importieren versuchen. Sie können requests verwenden, um Daten von der Webseite io zu laden, um einen Puffer an df.read_csv und delim_whitespace=True übergeben, um die Trennzeichen zu behandeln.

import requests 
import io 
import pandas as pd 

resp = requests.get('https://www.stat.berkeley.edu/~statlabs/data/babies.data') 
df = pd.read_csv(io.StringIO(resp.text), delim_whitespace=True) 

df.columns 
Index(['bwt', 'gestation', 'parity', 'age', 'height', 'weight', 'smoke'], dtype='object') 

df.head() 
Out[749]: 
    bwt gestation parity age height weight smoke 
0 120  284  0 27  62  100  0 
1 113  282  0 33  64  135  0 
2 128  279  0 28  64  115  1 
3 123  999  0 36  69  190  0 
4 108  282  0 23  67  125  1