In Pandas konnte ich früher eine Datenframe-Spalte verwenden, sie mit einer zweiten Datenspalten-Spalte vergleichen und alle fehlenden Elemente aus dieser zweiten Spalte erhalten :Abrufen aller Werte in einer Spalte, die in keiner anderen Spalte vorhanden sind
notYetIncluded = notYetIncluded.loc[~notYetIncluded["ID"].isin(df_o["ID"])]
jedoch, dass nicht mehr funktioniert in den aktualisierten Pandas (erhalte ich die Fehler ValueError: Buffer dtype mismatch, expected 'Python object' but got 'long long'
). Wie mache ich das?
Der Teil, den Bruch zu verursachen scheint, ist dies: notYetIncluded["ID"].isin(df_o["ID"])
Ich weiß nicht, ob es hilft, aber diese Spalten zur Zeit speichern nur Zahlen wie 4150
, 5808
usw. Sie sind alle 4 Ziffern oder weniger lang.
Zum Beispiel:
notYetIncluded: 0 5747 1 5746 2 5725 3 5722 4 5720 5 5707 Name: ID, dtype: object
df_o: 24 5365 4 5720 15 5599 Name: ID, dtype: int64
Was sind die Datentypen dieser Spalten? – MattR
Dies ist insbesondere eine Nummer – Elliptica
sind sie beide "Nummern"? Versuchen Sie 'print (dataframe.dtypes)' und lassen Sie uns wissen, was die Datentypen dieser Spalten sind – MattR