ich eine neue Operation auf Spark-SQL hinzufügen möchten, habe ich bereits benutzerdefinierte Funktion der Formhinzufügen Funken benutzerdefinierte Operationen SQL
dataframe.filter(udf("$a", "$b"))
Ich brauche verwendet eine ähnliche Funktion hinzuzufügen, sondern arbeitet auf zwei Datenrahmen, für Beispiel Hinzufügen einer Funktion wie:
dataframe1.udf(dataframe2))
Um genauer zu sein, ist die Funktion eine optimierte Verknüpfung auf zwei Datenrahmen.
Der eigentliche Code ist
CustomJoin(dataframe1,dataframe2)
ist dies möglich mit benutzerdefinierten Funktionen? Irgendwelche anderen Lösungen oder Beispiele?
kann Sie sind genauer, was Sie genau machen wollen? – mtoto
Offenbar, den Link zu lesen. das ist nicht möglich. Ich möchte einen benutzerdefinierten Join schreiben. Tatsächlich funktioniert der Code wie folgt: 'CustomJoin (df1, df2)'. Mein Ziel ist es, es so zu ändern 'df1.CustomJoin (df2)' – syl
Können Sie bitte Beispieldaten, Code und erwartete Ausgabe liefern? Ab jetzt ist deine Frage noch zu weit gefasst. – mtoto