1
Ich lese eine DataFrame
aus einer CSV wie diese Datei:Fehler beim Filtern von Datenrahmen
val rawData = sqlContext.read
.format("com.databricks.spark.csv")
.option("header", "false")
.option("inferSchema", "true")
.load(url)
Dann Ich versuche es durch das folgende Kriterium zu filtern: Das erste Element jeder Reihe soll ein String enthält entweder oder BBB
. Dazu habe ich den Code:
val filteredData = rawData.filter(me => (me(0).toString.contains("AAA") || me(0).toString.contains("BBB")))
Allerdings erhalte ich diese Fehlermeldung:
Error:(104, 41) missing parameter type
val filteredData = rawData.filter(me => (me(0).toString.contains("AAA") || me(0).toString.contains("BBB")))
Was ich falsch mache?
Ich verstehe nicht, wie dieser Filter funktioniert. Sollte es nicht "rohe Daten" Element für Element nehmen? – octavian
Da Sie mit 'DataFrame' arbeiten, müssen Sie definieren, was wir mit' 'Column's tun müssen (wie in SQL). Ihr Ansatz würde funktionieren, wenn Sie RDDs verwenden würden. –