2016-09-19 3 views
-6

Ich habe eine TXT-Datei, die einige Zeilen hat, möchte ich herausfinden:
Hat diese Datei die gleichen Zeilen?Suche nach wiederholten Zeilen in Python

Zum Beispiel: Das sind meine Zeilen:

 
7924265e2024daa24f801290d070a519 
f1cbfec6b396152da87e6a4279a4ad81 
8d1a705ed05f734a03e890db5467ea0a 
021128daa2fb3dc8b7c5af9e49e24439 
e2ec22e390c5910eb4e952208bb1c47d 
8d1a705ed05f734a03e890db5467ea0a 
7f65a7f8a160431cc8f69cd1f04b0aba 
d8e5f74f296cd47a30915bbbd2418d66 
005f8b973ebe30fd19b1bf802ffb6b32 
+4

Was Sie versuchen, so weit? –

+0

Wenn Sie eine korrekte Antwort erhalten möchten, müssen Sie Ihre Antwort mit dem von Ihnen getesteten Code aktualisieren und uns das Problem mit Ihrem Code mitteilen. Auch diese Frage als eine Menge von doppelten und ähnlichen Fragen in SO. – Kasramvd

+0

Danke @Kasramvd, ich mache es natürlich, zuerst werde ich den Code testen, den Sie vorgeschlagen haben. – Aref

Antwort

1

Ich nehme an, Sie haben in den Zeilen gelesen und gespeichert sie in einem Array

lines 

Dann

set(lines) 

gibt Sie ein Set, das alle eindeutigen Zeilen enthält. Wenn jede Zeile eindeutig ist, ist die Länge der Zeilen und der Satz (Zeilen) gleich. Ergo:

if len(lines) == len(set(lines)): 
     print 'all lines are unique' 
    else: 
     print 'not all lines are unique' 
0

Arbeitete wie ein Charme:

with open("file","r") as f: 
    seen = set() 
    for line in f: 
     line_lower = line.lower() 
     if line_lower in seen: 
      print(line) 
     else: 
      seen.add(line_lower)