Ich versuche Pandas zu verwenden, um ein Problem zu lösen, das von einem Idioten DBA gemacht wird, der keine Sicherung eines jetzt abgestürzten Datensatzes macht, also versuche ich, Unterschiede zwischen zwei Spalten zu finden. Aus Gründen, auf die ich nicht eingehen werde, verwende ich Pandas statt einer Datenbank.Wie kann ich einen SQL-Stil disjunkten oder einen Unterschied für zwei Pandas DataFrame-Objekte festlegen?
Was ich gerne machen würde ist, gegeben:
Dataset A = [A, B, C, D, E]
Dataset B = [C, D, E, F]
Ich möchte Werte finden, die disjunkt sind.
In SQL ist dies Standard-Set-Logik, unterschiedlich je nach Dialekt, aber eine Standardfunktion erreicht. Wie verwende ich das elegant in Pandas? Ich würde gerne etwas Code eingeben, aber nichts, was ich habe, ist sogar im Entferntesten korrekt. Es ist eine Situation, in der ich nicht weiß, was ich nicht weiß ... Pandas hat Logik für Schnittpunkt und Vereinigung gesetzt, aber nichts für Disjunkt/Satzunterschied.
Danke!
Danke, Das hat fantastisch funktioniert! – JPKab