Funken RDD saveAsTextFile nicht verwenden, um die angegebenen Dateinamen

Ich habe einige Codes wie dieseFunken RDD saveAsTextFile nicht verwenden, um die angegebenen Dateinamen

wordCounts 
    .map{ case (word, count) => 
    Seq(
     word, 
     count 
    ).mkString("\t") 
    } 
    .coalesce(1,true) 
    .saveAsTextFile("s3n://mybucket/data/myfilename.csv")

jedoch myfilename.csv als Verzeichnis in meinem S3 Eimer und die Dateinamen so etwas wie myfilename.csv ist immer erstellt wurde/Teil-00000? Gibt es eine Möglichkeit, den Namen der Datei, in die ich schreibe, zu ändern? Vielen Dank!

Quelle

2016-04-15 RandomBookmark

http://StackOverflow.com/A/25310729/2706419 können Sie dies –

versuchen Danke für den Link, sehr hilfreich – RandomBookmark

Ich schlage vor, dass Sie das Spark-CSV-Paket von Databrick zum Lesen und Schreiben von CSV-Dateien in Spark verwenden. Einer der (vielen) Vorteile der Verwendung dieses Pakets ist, dass Sie den Namen der Ausgabe-CSV-Datei angeben können :)

Quelle

2016-04-15 09:30:16

Danke Glennie. Dies ist definitiv etwas, was ich überprüfen werde (ich werde es für jetzt als akzeptiert markieren). – RandomBookmark

Funken RDD saveAsTextFile nicht verwenden, um die angegebenen Dateinamen

Antwort

Verwandte Themen