Ich habe eine große Arbeitsblattdatei (.xlsx), die ich mit Python-Pandas verarbeite. Es kommt vor, dass ich Daten von zwei Tabs in dieser großen Datei benötige. Einer der Tabs hat eine Menge Daten und der andere ist nur ein paar quadratische Zellen.Verwenden von Pandas zu pd.read_excel() für mehrere Arbeitsblätter derselben Arbeitsmappe
Wenn ich pd.read_excel() auf jedes Arbeitsblatt verwenden, sieht es für mich wie die gesamte Datei (nicht nur das Arbeitsblatt Ich habe Interesse an) geladen wird. Wenn ich also die Methode zweimal benutze (einmal für jedes Blatt), muss ich tatsächlich das gesamte Arbeitsbuch zweimal lesen (obwohl wir nur das angegebene Blatt verwenden).
Verwende ich es falsch oder ist es auf diese Weise begrenzt?
Vielen Dank!
FWIW, es sieht aus wie (letzte Mal, dass ich es getestet) den ersten Linienlasten in * alles *, also gibt es keine Möglichkeit, effizient ein einzelnes Blatt einziehen, aber mindestens mehrere Blätter zu erhalten, erfordert nicht mehrere Lasten des gesamten Blattes. – HaPsantran
Diese Antwort wurde von Pandas veraltet und stürzt jetzt für mich in v0.21.0 ab. Es sollte durch den von @ Mat0kan gegebenen ersetzt werden. – DStauffman
@Dtauffman Das funktioniert immer noch gut für mich und ich sehe keine Hinweise aus dem Code oder der Dokumentation, dass dies veraltet ist. Wenn Sie Probleme damit haben, würde ich ein Problem auf dem Github für Pandas oder xlrd (die Python-Excel-Parsing-Bibliothek von Pandas) einreichen – Noah