Ich führe ein Ruta-Skript dynamisch aus einem Java Maven-Projekt aus. Das Skript kommentiert eine HTML-Datei und die Ausgabe wird weiterverarbeitet. Jetzt, da der coveredText wie folgt HTML-Tags dazwischen enthält:Wie ignoriert man MARKUPs von der Ruta-Ausgabe oder von JCas?
(a + b) < sup> 2 </SUP> ==> ist Markiert als Formel
Aber ich will es als
(a + b) 2 ==>, wo die Überschrift ist als eine weitere Anmerkung erfasst und später behandelt.
Wie bei der erwarteten Lösung zu finden?
In UIMA ist das Dokument Text statisch. Wenn Sie den Text ändern möchten, müssen Sie eine neue Ansicht/CAS erstellen. In Ruta gibt es drei Komponenten, die eine CAS mit geändertem Dokumententext erstellen können: HtmlConverter, RutaModifier, RutaCutter. Wenn Sie es weiter verarbeiten möchten, benötigen Sie eine aggregierte AE mit Sofakartierung. –
Wie geht das? Plz helfen Sie mir mit einigen Codierungen oder Links. Vielen Dank ! –