2017-05-21 2 views

Antwort

1

Sie Angenommen, sind mit dem Penn part-of-speech tags arbeiten,

<NN.*>+ Matches mindestens einer der

  • NN: Nomen, Singular oder Masse
  • NNS: Nomen, Plural
  • NNP: Proper noun, singular
  • NNPS: Proper Substantiv

<JJ> Einstimmungen mindestens Null Adjektive (nicht Vergleichs- oder superlative), so dass optional ist.

Der Teil <JJ>* <NN.*>+ Ihrer RegEx entspricht somit mindestens einem Nomen. Vor diesem Nomen kann eine beliebige Anzahl von Adjektiven stehen. Zum Beispiel:

  • cats
  • brown cats
  • cute brown cats

(<JJ>* <NN.*>+ <IN>)? bedeutet, dass die oben durch eine andere Nominalphrase und einer Präposition (IN) wie

    vorangestellt werden
  • green eyes of cute brown cats

KT ist kein Wortart-Tag. Der Code, auf den Sie verwiesen haben, funktioniert mit NLTK's RegexpParser, wobei Grammatiken (ungefähr) wie Label: {rules} definiert sind. Also KT ist wirklich nur eine Bezeichnung, die jede identifizierte Nominalphrase nimmt; Sie könnten es auch NP oder NounPhrase nennen.