Ich bin neu bei Scala Spark und ich habe eine Frage.Scala Spark RDD sortieren nach Index der Teilzeichenfolge
Ich habe RDD, die 120 Millionen Strings enthält, ich versuche, alle Zeichenfolge zu finden, die die Teilzeichenfolge enthält. das geht mir gut.
Jetzt möchte ich die Ausgabe durch den Index so sortieren, dass die gefundene Zeichenfolge, die die Unterzeichenfolge näher am Anfang ist, zuerst gefunden wird.
Zum Beispiel:
Die Unterkette: abcdefg
Die Saiten:
s1 = tryu abcdefg yui
s2 = tr abcdefg yui
s3 = abcdefg yuo
So soll meine gewünschte Ausgabe eine Liste \ rdd sein, die sortiert wird {s3, s2, s1}
Was ist der beste Weg, dies zu tun?