HALLO allePython: Lese Teil einer Textdatei
Ich bin neu in Python und Programmierung. Ich brauche in Stücke einer großen Textdatei zu lesen, sieht Format wie folgt aus:
<word id="8" form="hibernis" lemma="hibernus1" postag="n-p---nb-" head-"7" relation="ADV"/>
Ich brauche die form
, lemma
und postag
Informationen. z.B. für oben brauche ich hibernis
, hibernus1
und n-p---nb-
.
Wie sage ich Python zu lesen, bis es Formular erreicht, weiterzulesen, bis es das Anführungszeichen "
erreicht und lesen Sie dann die Informationen zwischen den Anführungszeichen "hibernis"
? Wirklich damit zu kämpfen.
Meine bisherigen Versuche waren, die Interpunktion zu entfernen, den Satz zu spalten und dann die Informationen, die ich brauche, aus einer Liste zu ziehen. Wenn ich Probleme habe, Python über die ganze Datei zu iterieren, kann ich das nur für eine Zeile erreichen. Mein Code ist unten:
f=open('blank.txt','r')
quotes=f.read()
noquotes=quotes.replace('"','')
f.close()
rf=open('blank.txt','w')
rf.write(noquotes)
rf.close()
f=open('blank.txt','r')
finished = False
postag=[]
while not finished:
line=f.readline()
words=line.split()
postag.append(words[4])
postag.append(words[6])
postag.append(words[8])
finished=True
schätzen würde jedes Feedback/Kritik
dank
Danke Retracile. Probieren Sie einfach Ihren Code und es ist genau das, was ich brauche. Schätze wirklich deine Hilfe. Ich habe das re-Modul zuerst versucht und hatte den folgenden Ausdruck: für Zeile in f: wenn re.match ("(. *) (F | 1) orm (. *)", Zeile): print >> rfformat, line, –
, aber dummerweise gab er diese Methode auf und entschied sich für die Listenmethode. Ich werde jetzt das Modul re studieren und stellen Sie sicher, ich weiß, was Ihr Code tut –
Vielen Dank wieder, sehr geschätzt –