Ich suche den gesamten Text zwischen einem sich wiederholenden Muster in einer Textdatei zu extrahieren. Meine Textdatei XYZ.txt sieht ungefähr so aus:Extrahieren von wiederholten Mustern aus einer Textdatei in Python
Start
This is a great day
End
Start
This is another great day
End
Start
This is 3rd great day
End
ich suche extrahieren den gesamten Text zwischen jedem Start und Ende, sollte meine Ausgabe wie:
This is a great day
This is another great day
This is 3rd great day
und ich bin auf der Suche nach Speichere alle Ausgaben als separate HTML-Datei. Der Code, den ich verwende, ist wie folgt:
import re
with open('XYZ.txt') as myfile:
content = myfile.read()
text = re.search(r'Start\n.*?End', content, re.DOTALL).group()
print(text)
Aber Code oben nur druckt die erste Zeile. Ich bin mir nicht sicher, wie ich alle Werte zwischen den Mustern drucken und sie als separate HTML-Dateien speichern kann. Ich würde wirklich jede mögliche Richtung schätzen.
Danke
haben Sie versucht, mit readlines()? Außerdem, ohne Regex zu verwenden, bin ich ziemlich sicher, dass Sie Zeilen "ignorieren" können, die die Zeichenfolge START und/oder END enthalten – glls