zu leeren habe ich eine RDDeine RDD initialisieren
genanntJavaPairRDD<String, List<String>> existingRDD;
Jetzt muss ich existingRDD
diese initialisieren zu leeren, so dass, wenn ich die tatsächlichen rdd die bekomme ich mit diesem existingRDD
eine Vereinigung tun können. Wie initialisiere ich existingRDD
auf eine leere RDD mit Ausnahme der Initialisierung auf Null? Hier ist mein Code:
JavaPairRDD<String, List<String>> existingRDD;
if(ai.get()%10==0)
{
existingRDD.saveAsNewAPIHadoopFile("s3://manthan-impala-test/kinesis-dump/" + startTime + "/" + k + "/" + System.currentTimeMillis() + "/",
NullWritable.class, Text.class, TextOutputFormat.class); //on worker failure this will get overwritten
}
else
{
existingRDD.union(rdd);
}
Ich bin mir nicht sicher, ich verstehe ganz, was Sie versuchen zu tun. Sie möchten eine Union auf einer leeren RDD erstellen? Wozu? – eliasah
Ja. Wenn ich durch jedes RDDD falle ich foreachRDD in meinem Code meine ich muss Vereinigung von RDDs zu diesem existingRDD tun, damit ich dieses vorhandene RDD zu meinem s3 speichern kann –
Warum können Sie nicht einfach das 'existingRDD' auf 'rdd' in den stellen erste Iteration nach dem Schreiben auf s3? –