Ich möchte Dataframe zu s3 speichern, aber wenn ich die Datei zu s3 speichern, erstellt es leere Datei mit ${folder_name}
, in dem ich die Datei speichern möchte.Pyspark Speichern Sie Datenframe zu S3
Syntax der Datenrahmen zu speichern: -
f.write.parquet("s3n://bucket-name/shri/test")
Es speichert die Datei in Testordner aber es schafft $test
unter shri
.
Gibt es eine Möglichkeit, die ich speichern kann, ohne diesen zusätzlichen Ordner zu erstellen?
Um eine Datei zu schreiben, müssen Sie einen Testamentsvollstrecker verwenden, und einen Druckminderer, die den Zweck Spark verteilten Natur besiegt –