Ich habe die Sätze in Wort RDD in Tokens umgewandelt. Jetzt brauche ich Bigrams.
ex. This is my test => (This is), (is my), (my test)
Ich habe Suche durch und gefunden .sliding
Operator für diesen Zweck. Aber ich bekomme diese Option nicht auf meiner Sonnenfinsternis (möglicherweise ist sie für eine neuere Version von Spark verfügbar)
Also was kann ich machen, ohne .sliding
?Bigrams in Funke mit Java (8) finden
Hinzufügen von Code zu bekommen started-
public static void biGram (JavaRDD<String> in)
{
JavaRDD<String> sentence = in.map(s -> s.toLowerCase());
//get bigram from sentence w/o sliding - CODE HERE
}
Können Sie Ihren Code veröffentlichen? Sliding funktioniert nur bei iteratble, so dass Sie mapPartition mit gleiten verwenden können. Sobald Sie den Code hochladen, könnte ich etwas schreiben –
@ Z-Star veröffentlicht – insomniac