Bitte helfen Sie mir, das Problem zu lösen. Ich habe eine große Textdatei und ich muss doppelte Zeilen entfernen. Das Problem ist, dass die Duplizierung manchmal mehrere Zeilen umfasst Zum Beispiel die ersten beiden Zeilen ist einzigartig und sie wiederholen sich dreimal. Ich muss diese Paare von wiederholten Zeilen entfernen. Ich muss Duplikate nur löschen, wenn sie nacheinander erscheinen. Die Bedingung ist vor dem Erscheinen einiger anderer Zeilen erfüllt, bedeutet, dass wir erneut die Anzahl der eindeutigen Zeilen überprüfen müssen, die wiederholt werden.Duplikate entfernen, die sich über mehrere Zeilen erstrecken
PRÜFDATEN
Testlinie 1
Testlinie 2
Testlinie 1
Testlinie 2
Testlinie 1
Testlinie 2
Einige andere Linien
...............................
Testlinie 1
Testlinie 2
Testlinie 3
Einige andere Linien
........................ .......
Testlinie 1
Testlinie 2
Testlinie 3
Testlinie 1
Testlinie 2
Testlinie 3
Testlinie 1
Testlinie 2
Testlinie 3
Einige andere Linien
..................... ..........
Testlinie 1
Testlinie 1
Testlinie 1
Einige andere Linien
...............................
Testlinie 1
Testlinie 2
Testlinie 3
Testlinie 4
Testlinie 1
Testlinie 2
Testlinie 3
Testlinie 4
Einige andere Linien
................ ...............
Erwartetes Ergebnis
Testlinie 1
Testlinie 2
Einige andere Linien
.................... ...........
Testlinie 1
Testlinie 2
Testlinie 3
Einige andere Linien
...............................
Testlinie 1
-Test Linie 2
Testlinie 3
Einige andere Linien
...............................
Testlinie 1
Einige andere Linien
...............................
Testlinie 1
Testlinie 2
Testlinie 3
Testlinie 4
Einige andere Linien
.............................. .
Jim Mischel danke für die Klärung meiner Frage. Ich habe verstanden, dass ich Beispiel gemacht habe, das nicht einfach zu verstehen ist. Ich weiß, wir können Set zum Filtern verwenden, aber es ist nicht das, was ich brauche.
Ich brauche - Entfernen Sie benachbarte doppelte Linien und Sequenzen von Linien.
Ich versuche 1,1
in 1
und 1,2,1,2,1,2
in 1,2
zu ändern, aber 1,2,3,1,2
nicht verändert werden würde. Bitte Hinweis, dass die Anzahl der wiederholten Zeilen unterschiedlich sein kann. Es kann 1,2,1,2,1,2
in 1,2
oder 1,2,3,1,2,3,1,2,3
in 1,2,3
oder 1,2,3,4,1,2,3,4,1,2,3,4
in 1,2,3,4
Diejenigen, die „just-Sets verwenden“, lesen Sie bitte die Frage beantworten würde, und die Beispiele studieren. Er fragt nicht, doppelte Zeilen zu entfernen, sondern * benachbarte * doppelte Zeilen und Zeilenfolgen. Also versucht er, '1,1' in' 1' und '1,2,1,2,1,2' in' 1,2' zu verwandeln, aber '1,2,3,1,2' würde es nicht geben. t geändert werden. –
Sets sind eine eingebaute Funktion von Python, es wird das Problem nicht lösen, weil dies ein logisches Problem ist, das durch korrektes Codieren gelöst werden kann. Ich werde das nicht beantworten, weil ich nicht deine Arbeit mache. Die Verwendung von Sets kann jedoch ein nützliches Werkzeug sein. –