Ich importiere eine Excel-Datei in einen Pandas-Datenrahmen mit der pandas.read_excel()
-Funktion.Python Pandas: wie Datentypen beim Lesen einer Excel-Datei angeben?
Eine der Spalten ist der Primärschlüssel der Tabelle: Es sind alle Zahlen, aber es wird als Text gespeichert (das kleine grüne Dreieck oben links in den Excel-Zellen bestätigt dies).
Wenn ich jedoch die Datei in einen Pandas-Dataframe importiere, wird die Spalte als Float importiert. Beispiel: '0614' wird zu 614.
Gibt es eine Möglichkeit, den Datentyp beim Importieren einer Spalte anzugeben? Ich verstehe, dass dies beim Importieren von CSV-Dateien möglich ist, aber nichts in der Syntax von read_excel()
finden konnte. Die einzige Lösung, die ich mir vorstellen kann, besteht darin, einen willkürlichen Buchstaben am Anfang des Textes (Umwandlung von '0614' in 'A0614') in Excel einzufügen, um sicherzustellen, dass die Spalte als Text importiert und dann abgehackt wird das 'A' in Python, damit ich es mit anderen Tabellen vergleichen kann, die ich aus SQL importiere.
Ich hatte verstanden "Konverter" eine Funktion für die Spalte angegeben. Offensichtlich lag ich falsch - danke, dass du es aufgezeigt hast, es ist sehr nützlich! –
Wo finde ich die Liste der zulässigen Konverterfunktionen? Ich sehe 'str' hier, aber vermutlich gibt es' int' und ein paar mehr - gibt es einen Link irgendwo zu den Quelldokumenten, die die möglichen Konverterfunktionen auflistet? –
Ich habe auch keine Liste gefunden. Da "Konverter" Funktionen annehmen, vermute ich, dass Ihre Vorstellungskraft die Grenze ist, nur damit Sie innerhalb der Grenzen der "Konverter" -Funktionalität bleiben (d. H. Sie wurde entwickelt, um Funktionen zu verwenden, die nur eine Eingabevariable benötigen!). – tnknepp