Ich bin sehr neu in der ANTLR-Welt und ich versuche herauszufinden, wie kann ich dieses Parsing-Tool verwenden, um eine Reihe von "verrauschten" String zu interpretieren. Was ich gerne erreichen möchte, ist folgendes.
lassen Sie uns zum Beispiel nehmen diesen Satz: It's 10PM and the Lazy CAT is currently SLEEPING heavily on the SOFA in front of the TV
ANTLR auf einem verrauschten Datenstrom
Was ich CAT
extrahieren möchte, ist, SLEEPING
und SOFA
und haben eine Grammatik, die leicht die folgenden Muster entsprechen: SUBJECT - VERB - Dativobjekt ... wo ich
VERB : 'SLEEPING' | 'WALKING';
SUBJECT : 'CAT'|'DOG'|'BIRD';
INDIRECT_OBJECT : 'CAR'| 'SOFA';
etc definieren könnte .. ich will nicht endet mit einem permanenten „NoVi cableException ", da ich nicht alle Möglichkeiten der Sprachstruktur beschreiben kann. Ich möchte nur nutzlose Wörter auseinanderreißen und nur diejenige behalten, die interessant ist.
Es ist mehr wie wenn ich einen tokeniser hatte und fragte den Parser „Ok, den Stream lesen, bis Sie einen Betreff finden, dann den Rest ignorieren, bis Sie ein VERB finden, etc ..“
Ich brauche ein extrahieren organisierte Struktur in einer nicht organisierten Satz ... zum Beispiel würde ich mag der Lage sein, zu interpretieren (ich bin die Stichhaltigkeit dieser äußerst einfach und falsche Ansicht von ‚Englisch Grammatik‘ nicht zu urteilen)
SUBJECT - VERB - INDIRECT OBJECT
INDIRECT OBJECT - SUBJECT - VERB
so werde ich Sätze wie
It's 10PM and the Lazy CAT is currently SLEEPING heavily on the SOFA in front of the TV
analysieren
oder It's 10PM and, on the SOFA in front of the TV, the Lazy CAT is currently SLEEPING heavily
Das ist genau das, was ich erreichen wollte! Dies ist viel intuitiver als JavaCC im Umgang mit dieser Art von Filter – BlackLabrador
@BlackLabrador, Gern geschehen. –