Ich habe ein wirklich seltsames Problem. Ich habe drei Dateien, die eine Spalte mit Zahlen enthalten. Ich brauche NUR eindeutige Werte von der ersten Datei, die nicht in der zweiten und dritten Datei vorhanden sind.Zwei Dateien Vergleich
Ich habe versucht, Python wie:
for e in firstfile:
if e not in secondfile:
resultfile.append(e)
return resultfile
Und gleiche gilt für dritte Datei.
Ich habe versucht, uniq, sortieren, diff, einige awk-Skripte und comm in Linux-Shell wie hier: Fast way of finding lines in one file that are not in another?
Aber das einzige Ergebnis, das ich jedes Mal bekommen, ist die gleiche Menge an LINIEN WIE IM EHEMALIGEN FIRST Datei wurde. Ich verstehe es überhaupt nicht!
Vielleicht habe ich etwas verpasst? Vielleicht ist es etwas mit einem Format? Allerdings habe ich es oft überprüft. Hier sind die Dateien: http://dropmefiles.com/BaKGj
P.S. Später dachte ich, dass es überhaupt keine eindeutigen Zeilen gibt, aber ich habe es manuell überprüft, einige Zahlen in der ersten Datei sind einzigartig.
P.P.S. Das Format der Dateien ist wie folgt:
380500100000
380500100001
380500100002
380500100003
380500100004
380500100005
380500100008
380500100020
380500100022
380500100050
380500100070
380500100080
Wenn es nur eine Spalte von Zahlen ist, können Sie auch 20 von eacg einschließen, damit wir verstehen, welche Daten Sie verwenden. Putting sie dropmefiles hilft Menschen in der Zukunft nicht, wie die Datei in 7 Tagen entfernt wird. Ich würde auch die erste Datei laden und dann alles entfernen, das von der zweiten und dritten Datei geladen wird, wenn es in der ersten Datei existiert. – IvanD
Sicher, es ist eine nette Notiz. Bist du ein russophon? – tiredsys