2016-04-27 15 views
0

ich eine .xls-Datei, die in etwa so aussieht ...Python Pandas read_csv Import nicht richtig

Value of Construction Put in Place... 
(Millions of Dollars....) 
Blank Row 
Date Total_Construction Total Residential Total Nonresidential...Columns 
Dec-15 1,116,570   435,454   681,217 
Nov-15 1,115,966   432,295   683,671 
Oct-15 1,122,749   431,164   691,585 
. 
. 
. 

ich die Datei zu importieren versuchen folgendes zu erhalten:

Date Total_Construction Total Residential Total Nonresidential 
Dec-15 1,116,570   435,454   681,217 
Nov-15 1,115,966   432,295   683,671 
Oct-15 1,122,749   431,164   691,585 
. 
. 
. 

Mit der folgender Code:

for chunk in pandas.read_csv('/PATH/totsatime.xls', 
       names  = ['Date', 'Total Residential', 'Total Nonresidential'], 
       header  = 4, 
       chunksize = 1, 
       skiprows = range(1, 4), 
       thousands = ','): 

    if chunk['Date'] == 'Dec-01': 
     break 

    else: 
     df = pandas.DataFrame(chunk) 

aber ich am Ende mit dem folgenden:

Date    Total Residential  Total Nonresidential 
Lodging   NaN     NaN 
Office   NaN     NaN 
Commercial  NaN     NaN 
Health care  NaN     NaN 

Die Daten werden am Ende aus den Spalten formatiert, die ich nicht importiere. Jeder Rat würde sehr geschätzt werden.

Vielen Dank im Voraus.

+0

Ich denke, Sie sollten versuchen, 'read_excel': http: //pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html – alpert

+0

auch vergessen Brocken und Namen etc ... Nur read_excel und es wird wahrscheinlich das Richtige tun .. – dartdog

Antwort

Verwandte Themen