2016-06-09 8 views
0

Ich übersetze ein Dokument in eine CAT-Software und habe Probleme, mit einem stark markierten Dokument umzugehen. Die Software unterstützt reguläre Ausdrücke und ich hoffe, dass man erstellt werden kann, um mir bei diesem Problem zu helfen. Ich würde einen regulären Ausdruck brauchen, der alles zwischen dem Cursoreinfügepunkt bis zum "weniger als" Symbol <, das den Beginn eines Tags markiert, auswählt. So konnte ich sofort anfangen zu tippen und den Originaltext durch meine Übersetzung ersetzen. Und dann würde ich einen anderen Ausdruck benötigen, um das Tag zu springen, das heißt, den Cursor direkt nach dem letzten "Größer als" -Symbol zu platzieren, das als derjenige identifiziert werden kann, dem das "weniger als" -Symbol nicht folgt. Mit anderen Worten, der reguläre Ausdruck würde das Bewegen des Cursors an die Position direkt nach dem Symbol "größer als"> gefolgt von etwas anderem als dem Symbol "weniger als" < befehlen. Hier ist ein Beispiel:Regulärer Ausdruck, um Text zwischen Tags zu löschen

> Some student will investigate two dialects of </s1></s0><s2><s3>every 
> </s3></s2><s4><s5>language </s5></s4> 

Der Einfügemarke am Anfang des Satzes ist, kurz vor dem Wort „Some“ und ich brauche eine Regex, die alle den Text bis zum „kleiner als“ < Symbol auswählen, werden das heißt nach dem Wort "von". An diesem Punkt würde ich eine Regex brauchen, die den Einfügepunkt direkt vor dem Wort "jeder" springen würde.

+0

Können Sie den Text vor der Übersetzung in einen Texteditor (Unterstützung Regex, z. B. 'Notepad ++' ') laden. Dann ist es einfach, '<[^>] +>' durch eine leere Zeichenfolge zu ersetzen. [Wie folgt] (https://regex101.com/r/aD9yM2/1). – ClasG

+0

Vielen Dank vp_arth, da ich kein Programmierer bin, kann ich nicht sicher sein, aber obwohl es ähnlich wie meine Frage aussehen mag, fragt es nach einer anderen Sache mit einem regulären Ausdruck. Auch die Antworten auf den anderen Thread legen nahe, dass die Verwendung regulärer Ausdrücke mit HTML-Dateien nicht möglich ist, und ich bin mir nicht sicher, ob das Gleiche für XML-Dateien gilt, auf die ich einen regulären Ausdruck anwenden muss. Hoffentlich gibt mir jemand eine definitive Antwort auf meine Frage und jemand klärt das auf. –

+0

Vielen Dank für die Antwort ClasG. Ich kann das nicht, der Hauptpunkt bei der Verwendung von CAT-Software besteht darin, die Tags beizubehalten und den Text zwischen ihnen zu übersetzen. Auf diese Weise bleibt die Formatierung des Originaldokuments erhalten. –

Antwort

0

zum nächsten Tag auswählen kann ein wenig unklar, es ist mit

[^<]* 

Dann erfolgen, wenn die zweiten regex - den Tag überspringt - sollte einfach den Tag entspricht. Dann ist es

Wenn es den nächsten Text auswählen sollte, ist es komplizierter. Aber fangen wir damit an;).

+0

Danke für die Hilfe TEXHIK und ClasG. Ihr erster Ausdruck ClasG macht die erste Hälfte des Jobs, es wählt alles bis zum "weniger als" -Symbol aus, und das reicht, wenn ich vom Anfang des Satzes bis zum und übereinstimmen –

0

[^>]*(?=<) Findet den gesamten Text zwischen > und <. Es wird jedoch finden und wählen Sie das Ergebnis, nicht einen Cursor irgendwo platzieren.

Verwandte Themen