2017-06-10 1 views
0

Ich bin vertraut damit, wie man eine Excel-Tabelle in einen Pandas-Datenrahmen lädt. Dies setzt jedoch voraus, dass die Tabelle selbst wohldefinierte Spalten und Zeilen enthält. Ich habe 1 Excel-Tabelle, die mehrere Tabellen enthält und jede Tabelle hat unterschiedliche Anzahl von Zeilen und Spalten. Es gibt auch einen Text mit Tabellen in diesem Blatt. Irgendwelche Vorschläge, wie man diese in Pandas laden kann? Vielen Dank.Wie man eine unstrukturierte Excel-Tabelle in Pandas lädt?

+0

Parse es mit einem anderen 3rd-Party-Bibliothek sehen sie in einen Datenrahmen dann werfen, können wir einige Beispieldaten oder etwas bekommen ? –

+0

Ich möchte es programmgesteuert tun, idealerweise ohne irgendeine andere Bibliotheksnutzung durch Dritte, wenn möglich. Die Beispieldaten finden Sie hier: https://ufile.io/5novd –

Antwort

0

Pandas unterstützen viele Datenformate.

  1. Verwendung pd.read_excel, es Excel-Tabelle Datei (.xlsx)

  2. Export-Tabelle zu csv lesen und pd.read_csv verwenden. Ich genieße es, diese Methode zu verwenden.

  3. Verwendung pd.ExcelFile zu laden, ist es sieht gleichermaßen Methode 1., aber es ist auch schneller other answer

+0

danke, ja, ich habe das pd.read_excel schon ausprobiert. Aber wie man es verwendet, um ein Excel-Blatt zu analysieren, das mehrere Tabellen mit inkonsistenter Struktur hat? Bitte sehen Sie sich die Beispieldaten unter https://ufile.io/5novd –

+0

an, ich empfehle, sie in mehrere Tabellen zu teilen. Es ist schwierig mit verschiedenen Strukturen in Pandas umzugehen. In Ihrer Datei kann Zeile [2: 7] ein einzelner Pandas DataFrame sein. Nach dem Laden mehrerer Strukturen, concat oder behandeln Sie Ihre Daten! – Maybe

Verwandte Themen