Bisher habe ich eine Struktur wie diese auf der Spitze aller meiner Dateien (I Rohdaten verarbeiten und mit Pandas Analyse tun so mit einer Menge von Rohdaten Ich arbeite):Erstellen einer Datei zum Suchen von Pfaden und Dateinamen?
raw_location = 'C:/Users/OneDrive/raw/'
output_location = 'C:/Users/OneDrive/output/'
mtd_location = 'C:/Users/OneDrive/modified/'
py_location = 'C:/Users/OneDrive/py_files/'
Es Es gibt eine Menge verschiedener Pfade und einige .py-Dateien verwenden denselben Pfadnamen, um auf einen anderen Pfad zu verweisen (z. B. ist raw_location die Quelle der Daten, die für verschiedene Dateien unterschiedlich sind). Es ist ein Durcheinander geworden.
Unter den Standorten habe ich eine Liste von Dateinamen (import_filename, modifizierte_Dateiname, Dashboard_Dateiname). Alles in allem verschwende ich mehr als 10 Zeilen Code in jeder Datei, nur um Variablennamen anzugeben. Ich weiß, dass es einen besseren Weg dafür geben muss.
Bis jetzt habe ich meine .py und .ipynb Dateien in Ordner innerhalb des Hauptverzeichnisses verschoben, was bedeutet, dass ich relative Pfade wie '../raw' verwenden kann, was geholfen hat. Kann ich eine Datei erstellen, in der alle Pfade und Dateinamenvariablen enthalten sind, und diese dann lesen, anstatt die Pfade oben in meinem Code aufzulisten? Was ist die beste Vorgehensweise hier?
Sie sollten eine Konfigurationsdatei schreiben, in dem Sie alle Informationen –
Speichern Sie die Pfade in einem Wörterbuch setzen, die als JSON-Datei gespeichert wird? Es ist schwer zu wissen, was die Absicht hier ist; Vielleicht würde ein vollständiges Neuschreiben der Skripte diese Probleme in diesem Prozess lösen. – jDo
Nun, ich könnte umschreiben. Ich frage jedoch nach einigen Best Practices, die zu befolgen sind. Ich merke, dass ich nicht viele explizite Pfade sehe, wenn ich auf den Code anderer Leute schaue, aber ich kenne nicht den besten Weg, dies zu vermeiden. Ich ging von Excel zu Pandas/Python, so dass ich nur langsam effizienter und organisierter werde. – trench