Ich möchte träge erstellen Dask Datenrahmen von einem Generator, der wie etwas aussieht erstellen:Träge dask Datenrahmen vom Generator
[parser.read(local_file_name) for local_file_name in repo.download_files())]
Wo beide parser.read und repo.download_files Rück Generatoren (mit Ausbeute). parser.read ergibt sich ein Wörterbuch von Schlüssel-Wert-Paare, die (wenn ich einfach nur Pandas mit wurde) in einer Liste jedes Wörterbuch sammeln würde, und dann verwenden:
df = pd.DataFrame(parsed_rows)
Was ist der beste Weg, um eine dask zu erstellen Datenrahmen davon? Der Grund ist, dass a) ich die Anzahl der zurückgegebenen Ergebnisse nicht unbedingt weiß, und b) ich weiß nicht die Speicherzuordnung des Computers, auf dem es bereitgestellt wird.
Alternativ was soll ich anders tun (zum Beispiel vielleicht eine Reihe von Datenrahmen erstellen und dann stattdessen die in zu dask sagen?)
Dank.