Ich habe einige schwere Stämme auf meinem Cluster, habe ich alle von ihnen mit dem folgenden Partitionsschema parqueted:Wählen Parkett basierend auf Partition Datum
PARTITION_YEAR=2017/PARTITION_MONTH=07/PARTITION_DAY=12
Zum Beispiel, wenn ich alle meine log auswählen möchten zwischen 2017/07/12 und 2017/08/10 gibt es eine Möglichkeit, es effektiv zu tun? Oder muss ich alle Tage durchlaufen, um die Partitionen einzeln zu lesen?
Danke,
https://stackoverflow.com/questions/33650421/reading-dataframe-from-partitioned-parquet-file – pasha701