Ich möchte eine JSON-Datei und zuordnen, so dass eine der Spalten eine Teilzeichenfolge eines anderen ist. Zum Beispiel mit der linken Tabelle zu nehmen und die richtige Tabelle erzeugen:create substring Spalte in Spark Dataframe
------------ ------------------------
| a | | a | b |
|------------| -> |------------|---------|
|hello, world| |hello, world| hello |
Ich kann diese mit Funken SQL-Syntax zu tun, aber wie kann es mit Hilfe der in-integrierten Funktionen getan werden?
Will Spalte ein immer zwei Wörter durch ein Komma begrenzt sein? Und wird Spalte b immer das erste Wort sein? – soote
nein und nein, idealerweise sollte die Lösung eine Teilzeichenkettenfunktion über Spalte a laufen lassen, um Spalte b zu produzieren –