sagen, dass ich zwei „ID“ Spalten in zwei Datenrahmen haben, ich möchte ID angezeigt werden von DF1 das tut in DF2 existiertAnzeige eindeutige Werte zwischen zwei Datenrahmen Spalten - pyspark
Ich weiß nicht, ob ich mitmachen verwenden sollte, fusionieren oder Isin.
cond = [df.name != df3.name]
df.join(df3, cond, 'outer').select(df.name, df3.age).collect()
nicht sicher, ob die Änderung der Bedingung mir das Ergebnis geben wird.
gibt es einen Fehler ‚Datenrahmen‘ Objekt hat kein Attribut ' loc '. das ist vielleicht für ein pandas df? – Jay
'df1 [~ df1 ['id']. Isin (df2 ['id'])]' das funktioniert auch. – ammy
funktioniert immer noch nicht – Jay