finden selten Zeilen zwischen zwei CSV-Dateien gemeinsames Feld mit

Ich habe eine CSV-Datei mit folgenden Datenfinden selten Zeilen zwischen zwei CSV-Dateien gemeinsames Feld mit

code 
AAA 
BBA 
CCC

und einem anderen CSV-Datei mit unterschiedlicher Struktur, aber gemeinsamer Spalte:

code 
AAA 
BBA 
CCF

mag ich finden welcher Code zuerst in dem zweiten Datenrahmen nicht existiert. In diesem Fall CCC.

Wie kann ich das tun?

Quelle

2016-05-08 nnnnmmm

http://stackoverflow.com/questions/6486450/python-compute-list-difference –

Da Sie das pandas Tag verwenden, gehe ich davon aus, dass Sie nach einer Lösung mit pandas suchen. Wenn Sie beide CSV-Dateien in zwei verschiedenen Datenrahmen gelesen hatte, dann unter der Annahme, dass die erste CSV in df_1 und die zweite in df_2 gelesen wird, können Sie dies tun:

>> df_1[~df_1['code'].isin(df_2['code'])][['code']]

oder

>> set(df_1['code'].values.tolist()) - set(df_2['code'].values.tolist())

oder

>> set(list(df_1['code'])) - set(list(df_2['code']))

Ich hoffe, das hilft!

Quelle

2016-05-08 00:35:35 Thanos

Danke das, was ich gesucht habe ... – nnnnmmm

Froh, dass es geholfen hat, viel Glück! – Thanos

finden selten Zeilen zwischen zwei CSV-Dateien gemeinsames Feld mit

Antwort

Verwandte Themen