Ich bin komfortabel mit Python/Excel/Pandas für meine Datenrahmen. Ich kenne SQL oder Datenbanksprachen nicht.Python Pandas große Datenbank mit Excel
Ich stehe kurz vor einem neuen Projekt mit rund 4000 verschiedenen Excel-Dateien, die ich habe. Ich rufe an, um die Datei als Datenframe für alle 4000 Dateien geöffnet zu haben, und mache dann meine Berechnungen an ihnen. Dies beinhaltet viele Berechnungen wie Summe, lineare Regression und andere normale Werte.
Meine Frage ist, ich weiß, wie man das mit 5-10 Dateien kein Problem macht. Werde ich ein Problem mit dem Speicher oder der Programmierung haben, die Stunden dauern wird? Die Dateien sind um 300-600kB. Ich benutze keine Funktionen in Excel nur Daten halten. Wäre es besser, 4.000 einzelne Dateien oder 4.000 Tabs zu haben. Oder kann ein Computer problemlos damit umgehen? Vielen Dank, dass Sie sich angeschaut haben, haben noch nicht mit vielen Daten gearbeitet und würden gerne wissen, ob ich wirklich versaut habe, bevor ich anfange.
Vielen Dank für Ihre Hilfe und Richtung. – Atropos