Gegeben eine Zeichenfolge, die einen Satz wie diesen darstellt, gefolgt von der Markierung der Zeichenfolge mit OpenNLP.Regulärer Ausdruck auf markierten Wörtern
String sentence = "His plays remain highly popular, and are constantly studied.";
ich dieses unten. Meine Frage ist, wie kann ich einen regulären Ausdruck darauf anwenden, um Tags herauszufiltern? Was mich abschreckt, ist das Wort, das jedem Bindestrich vorangestellt wird. Wenn es nur Tags wären, könnte ich etwas wie (VBP|VBN)+
zum Beispiel machen, die Wörter vorne würden variieren.
His_PRP$ plays_NNS remain_VBP highly_RB popular,_JJ and_CC are_VBP constantly_RB studied._VBN
Zum Beispiel, wie würde ich schreiben einen regulären Ausdruck alle NN
und CC
zu halten? Also gegeben die markierte Zeichenfolge wie oben gezeigt, wie bekomme ich plays_NNS and_CC
?
Bitte erläutern Sie das Problem anhand eines Beispiels. – EngineeredBrain
@AnwarShaikh Hoffnung, die hilft. –
Ja. Danke, hoffe mein Post unten beantwortet Ihre Frage. – EngineeredBrain