Ich möchte alle Wörter, die von einem bestimmten Kontext umgeben sind, aus einer großen Datei finden und extrahieren. Alle Zeilen in der Datei in etwa so aussehen wie diese, aber mit verschiedenen Worten zwischen >
und <\w>
:Suche Zeichenfolge in bestimmten Kontext mit grep
<="UO" lemma="|" lex="|" sense="|" prefix="|" suffix="|" compwf="|" complemgram="|" ref="05" dephead="04" deprel="ET">and<\w>
Ich möchte nur die Ausgabe sein ‚und‘. Ich möchte also im Grunde alle Zeichenfolgen (Wörter, Interpunktionen und Zahlen) extrahieren, die sich im Kontext >xxx<\w>
befinden. Ich habe versucht, eine Reihe von verschiedenen Alternativen mit grep und regex, aber ich entweder alle Wörter bekommen oder das Muster mit >
und <\w>
... Von der gesamten Datei, die ich die Ausgabe wie folgt aussehen wollen würde:
and
we
appreciate
this
very
much
.
Und so weiter ...
fügen Sie den Eingabetext und erwartete Ausgabe – RomanPerekhrest
Entschuldigung, aus irgendeinem Grund zeigte es nicht das erste Mal, dass ich gepostet –
"Ich will nur die Ausgabe zu sein" und "" ist keine ausreichende Erklärung dessen, was Sie erreichen wollen. Bitte geben Sie uns ein Beispiel dafür, wie die Ausgabe aussehen soll. Ansonsten, meine Empfehlung ist es, diesen Code zu verwenden: 'echo" und "' – sadmicrowave