Ich habe einige Datenrahmen mit 170 Spalten. In einer Spalte habe ich einen "name" -String und dieser String kann manchmal spezielle Symbole wie "'" haben, die nicht passend sind, wenn ich sie in Postgres schreibe. Kann ich etwas wie folgt aus:Spark Dataframe ändern Spalte Wert
Df[$'name']=Df[$'name'].map(x => x.replaceAll("'","")) ?
Ich möchte nicht die volle Datenrahmen analysieren, weil es sehr ist huge.Help mir bitte
ich habe ein ähnliches Problem aber es gibt eine bestimmte Liste von Werten das habe ich in einem Array: val ids = Array ("1e4f199c", "6681b1b0"). Ich muss überprüfen, ob die Spalte "id" einen Wert hat, der nur in ids ist, dann wird der Wert ersetzt, ansonsten wird der vorherige Wert beibehalten. Was mache ich dann? –
@SimpleFellow können Sie versuchen, die Funktionen 'when' und' isin' aus 'org.apache.spark.sql.functions' zu verwenden - wenn Sie Hilfe brauchen, um genau zu verstehen, wie, zögern Sie nicht, eine neue Frage zu stellen, ein bisschen zu viel zu antworte in einem Kommentar. –
hier ist es, das komplette Programm: https://stackoverflow.com/questions/48627959/how-to-update-few-records-in-spark –