Ich habe eine Reihe von Daten, die etwa wie folgt aussieht:Splitting Saiten auf zwei verschiedene Trennzeichen
1:a:x|y|z
2:b:y|z
3:c:x
4:d:w|x
Was ich will, ist ein Ausgang, der wie folgt aussieht:
1,a,x
1,a,y
1,a,z
2,b,y
2,b,z
3,c,x
4,d,w
4,d,x
Ich habe versucht, Aufteilen sowohl auf ':' als auch auf '|' aber es hat nicht geholfen, da es ein Ergebnis wie dieses gab:
1,a,x,y,z
2,b,y,z
3,c,x
4,d,w,x
Auch ist es eine Möglichkeit, die unerwünschten Werte aus dem rdd herausfiltern, die ich bekomme, wenn ich so herauszufiltern (w, y, z) von
1,a,x,y,z
2,b,y,z
3,c,x
4,d,w,x
Erwartete Ausgabe aussehen wird:
1,a,x
2,b, //it'll be fine if this doesn't even appear, better in fact
3,c,x
4,d,x
Irgendwelche Ideen?
Für die zweite Teil, Sie könnten eine separate Frage stellen, aber die kurze Antwort ist, '.filter()' zu verwenden. –