3
Ich möchte einige grundlegende Stemming auf einer Spark-Dataframe-Spalte durch Ersetzen von Teilzeichenfolgen durchführen. Was ist der schnellste Weg, dies zu tun?Pyspark ersetzen Zeichenfolgen in Spark-Datenframe-Spalte
In meinem aktuellen Anwendungsfall habe ich eine Liste von Adressen, die ich normalisieren möchte. Zum Beispiel dieses Datenrahmen:
id address
1 2 foo lane
2 10 bar lane
3 24 pants ln
id address
1 2 foo ln
2 10 bar ln
3 24 pants ln
Was ist Ihre Spark-Version? –