2016-09-05 4 views
3

Mein Excel-Blatt:Python Pandas read_excel erkennt nicht null Zelle

A B 
1 first second 
2 
3 
4 x y 
5 z j 

Python-Code:

df = pd.read_excel (filename, parse_cols=1) 

Rückkehr eine korrekte Ausgabe:

first second 
0 NaN NaN 
1 NaN NaN 
2 x  y 
3 z  j 

Wenn ich arbeiten wollen, nur mit zweiter Spalte

df = pd.read_excel (filename, parse_cols=[1]) 

Rückkehr:

second 
0 y 
1 j 

ich Informationen über leere Excel-Zeilen (NaN in meinem df) haben würde, selbst wenn ich nur mit einer bestimmten Spalte zu arbeiten. Wenn Ausgabe lose NaN Informationen, die es nicht in Ordnung, zum Beispiel für skiprows Paramater, etc

Dank

+1

Versuchen Sie den Parameter 'skip_blank_lines = False'? – jezrael

+0

Es funktioniert. Warum kann ich diesen Parameter hier nicht sehen: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html –

Antwort

4

Bei mir funktioniert Parameter skip_blank_lines=False:

df = pd.read_excel ('test.xlsx', 
        parse_cols=1, 
        skip_blank_lines=False) 
print (df) 

     A  B 
0 first second 
1 NaN  NaN 
2 NaN  NaN 
3  x  y 
4  z  j 

Oder wenn brauchen erste Zeile weglassen:

df = pd.read_excel ('test.xlsx', 
        parse_cols=1, 
        skiprows=1, 
        skip_blank_lines=False) 
print (df) 

    first second 
0 NaN NaN 
1 NaN NaN 
2  x  y 
3  z  j 
+0

Ja, es funktioniert. Aber warum sehe ich diesen Parameter nicht in der offiziellen Dokumentation? http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html –

+0

Siehe "Allgemeine Analysekonfiguration" in [docs] (http://pandas.pydata.org/pandas-docs/stable /io.html#io-read-csv-table), oder dieser Parameter ist in ['read_csv'] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html). – jezrael

+0

In offiziellen Dokumenten - ['read_excel'] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html) steht es hinter' ** kwds'; ( – jezrael

Verwandte Themen