2016-04-15 8 views
0

Ich habe einige Codes wie dieseFunken RDD saveAsTextFile nicht verwenden, um die angegebenen Dateinamen

wordCounts 
    .map{ case (word, count) => 
    Seq(
     word, 
     count 
    ).mkString("\t") 
    } 
    .coalesce(1,true) 
    .saveAsTextFile("s3n://mybucket/data/myfilename.csv") 

jedoch myfilename.csv als Verzeichnis in meinem S3 Eimer und die Dateinamen so etwas wie myfilename.csv ist immer erstellt wurde/Teil-00000? Gibt es eine Möglichkeit, den Namen der Datei, in die ich schreibe, zu ändern? Vielen Dank!

+0

http://StackOverflow.com/A/25310729/2706419 können Sie dies –

+0

versuchen Danke für den Link, sehr hilfreich – RandomBookmark

Antwort

0

Ich schlage vor, dass Sie das Spark-CSV-Paket von Databrick zum Lesen und Schreiben von CSV-Dateien in Spark verwenden. Einer der (vielen) Vorteile der Verwendung dieses Pakets ist, dass Sie den Namen der Ausgabe-CSV-Datei angeben können :)

+0

Danke Glennie. Dies ist definitiv etwas, was ich überprüfen werde (ich werde es für jetzt als akzeptiert markieren). – RandomBookmark

Verwandte Themen