Sie Angenommen, sind mit dem Penn part-of-speech tags arbeiten,
<NN.*>+
Matches mindestens einer der
NN
: Nomen, Singular oder Masse
NNS
: Nomen, Plural
NNP
: Proper noun, singular
NNPS
: Proper Substantiv
<JJ>
Einstimmungen mindestens Null Adjektive (nicht Vergleichs- oder superlative), so dass optional ist.
Der Teil <JJ>* <NN.*>+
Ihrer RegEx entspricht somit mindestens einem Nomen. Vor diesem Nomen kann eine beliebige Anzahl von Adjektiven stehen. Zum Beispiel:
cats
brown cats
cute brown cats
(<JJ>* <NN.*>+ <IN>)?
bedeutet, dass die oben durch eine andere Nominalphrase und einer Präposition (IN
) wie
vorangestellt werden
green eyes of cute brown cats
KT
ist kein Wortart-Tag. Der Code, auf den Sie verwiesen haben, funktioniert mit NLTK's RegexpParser, wobei Grammatiken (ungefähr) wie Label: {rules}
definiert sind. Also KT
ist wirklich nur eine Bezeichnung, die jede identifizierte Nominalphrase nimmt; Sie könnten es auch NP
oder NounPhrase
nennen.
Warum probierst du es nicht auf einem Text und siehst die Ergebnisse? –