I ersten 5 Zeilen zu einer hdfs Datei durch Funken Codeschreiben ersten 5 Zeilen in hdfs durch Funken Datei
sc.textFile("hdfs://localhost:8020/user/hadoop/data-master/retail_db/products/part-00000").map(rec => (rec.split(",")(4).toDouble, rec)).sortByKey(false).map(_._2)
Hier verwenden wir können saveAsTextFile API schreiben wollen, aber es ist eine Aktion, während wir Reihen begrenzen müssen durch Transformationen.
ich den Verdacht, dass dies bereits hier beantwortet wurde: https://stackoverflow.com/questions/34206508/is-there-a-way-to-take-the-first-1000-rows-of- a-Funke-Datenrahmen –
Mögliches Duplikat [gibt es eine Möglichkeit, die ersten 1000 Zeilen eines spark-Datenrahmen zu nehmen?] (https://stackoverflow.com/questions/34206508/is-there-a-way-to-take - der erste-1000-Zeilen-von-einem-Funken-Datenrahmen –