Ich bin ein Neuling auf funktionale Programmiersprache und ich versuche Funke scala Ziel zu lernen, ist die rdf datset nach Fach zu partitionieren der Code ist unten:partitionieren die rdf Datensätze nach Fach in Funken scala
object SimpleApp {
def main(args: Array[String]): Unit = {
val sparkConf =
new SparkConf().
setAppName("SimpleApp").
setMaster("local[2]").
set("spark.executor.memory", "1g")
val sc = new SparkContext(sparkConf)
val data = sc.textFile("/home/hduser/Bureau/11.txt")
val subject = data.map(_.split("\\s+")(0)).distinct.collect
}
}
So bekomme ich die Themen wiederherstellen, aber es gibt ein Array von String auch mapPartitions (func) und mapPartitionsWithIndex (func): die Funktion muss Iterator sein Also, wie gehe ich vor?
können Sie Fügen Sie ein Beispiel Ihrer Eingabedatei und die von ihr erzeugte Ausgabe hinzu. – jsdeveloper
Meine Eingabedatei ist ein RDF-Dataset im Format von Ntriples: Für jede Zeile haben wir den Betreff, das Objekt und Prädikat und für die Ausgabe generiert es: HashPartitioner kann keine Array-Schlüssel partitionieren. – Marry
Bitte markieren Sie die Antwort als richtig, wenn Sie Ihr Problem gelöst haben – jsdeveloper