Ist es möglich, einen Pandas-Datenrahmen direkt in eine Parkett-Datei zu speichern? Wenn nicht, was wäre der vorgeschlagene Prozess?Python: Speichern Pandas Datenrahmen zu Parkett-Datei
Ziel ist es, die Parkettdatei an ein anderes Team senden zu können, das sie mit scala code lesen/öffnen können. Vielen Dank!
Ist das andere Team Spark oder einige andere Scala-Tools? CSV laden ist Spark ist ziemlich trivial –
Wenn Sie 'pyspark' haben, können Sie etwas tun wie [dies] (https://gist.github.com/jiffyclub/905bf5e8bf17ec59ab8f#file-hdf_to_parquet-py) –