mit Wildcard in Spark-SQL

Ich habe ein Datenrahmen wie folgt aus:mit Wildcard in Spark-SQL

+-------------------------------------------+ 
|url          | 
+-------------------------------------------+ 
|/v3/references/genders      | 
|/en/job/restaurant-manager-6619735/panels | 
|/en/job-search/dealer-coordinator-jobs/ | 
|/en/job/engineer-3034030/panels   | 
|/en/job/business-analyst-5385899   | 
+-------------------------------------------+

Ich versuche, die Zählung für jede URL zu erhalten, die ‚Job‘ enthält. Ich habe das versucht, aber ich habe ein leeres Ergebnis bekommen.

df.createOrReplaceTempView("table") 
spark.sql("select url, count(url) from table where url like 'job'").show()

Was ist falsch mit diesem SQL? Danke!

Quelle

2016-08-24 Nuhaa All Bakry

Versuchen Sie dies.

spark.sql("select url, count(url) from table where url like '%job%' GROUP BY url").show()

Quelle

2016-08-24 08:51:37 abaghel

danke! funktioniert jetzt –

mit Wildcard in Spark-SQL

Antwort

Verwandte Themen