0
Wie verknüpfe ich Blogposts mit Tags in Spark?Beiträge mit Hilfe von Spark Scala zu Tags zuordnen
val posts = Seq("BMW is a good car",
"AUDI beats Tesla on speed race",
"BMW exposes its new vehicle at Montreal",
"Mercedes introduces beast offroad track")
val rdd = sc.makeRDD(posts)
val tags = Seq("BMW", "AUDI", "Mercedes")
auf Daten So basiert oben ich RDD[(String, Iterable[String]]
neu erhalten möchten:
("BMW", Iterable ("BMW ist ein gutes Auto", "BMW sein neues Fahrzeug in Montreal macht")
("AUDI", Iterable ("AUDI schlägt Tesla auf Speed-Rennen"))
wie es Irgendwelche Ideen ("Mercedes", Iterable() "Mercedes Tier Offroad-Strecke führt") konnte getan werden?
In einfachsten Form rdd.filter (row => row.contains ("BMW")) .Map (line => ("BMW", line)) .groupByKey() . sammeln() – Pushkr