ich einen Spark-SQL DataDrame
mit Spalten Breite und Länge, Ich versuche, Reihen zu filtern, die durch die Berechnung des Abstands zu einem Eingang unter einem Schwellenwert fallen. Mein aktueller Code aussieht. Ich verwende geopy
(great_circle
), um den Abstand zwischen Paaren langer lat berechnen.Filtering Spark-SQL Datenrahmen für den Fern
from geopy.distance import great_circle
point = (10, 20)
threshold = 10
filtered_df = df.filter(great_circle(point, (df.lat, df.lon)) < threshold)
Wenn ich diesen Code ausführen bekomme ich folgende Fehler
ValueError: Cannot convert column into bool: please use '&' for 'and', '|' for 'or', '~' for 'not' when building DataFrame boolean expressions.
Ich bin verwirrt auf dem ein Teil des Filterausdruck ist falsch.