2017-05-09 1 views
0

Ich arbeite an einer natürlichen Sprache Suchmaschine für Straßburg CDS. (Astronomisches Datenzentrum von Strasbourg)Proper Noun Erkennung in Akronyme mit dem POS Tagger

Ich frage mich, wie der Stanford Part-Of-Speech Tagger Akronyme markierte, da Akronym manchmal als NNP markiert sind und manchmal nur als NN markiert sind.

Ich konnte nicht genau herausfinden, wie das Programm entscheidet, ob ein Akronym wie "CDS" oder "NASA" ein NNP oder ein NN ist.

Wenn mir jemand zu diesem Thema helfen könnte, werde ich mich wirklich freuen. :)

Einen schönen Tag haben.

Antwort

0

Der POS-Tagger ist ein statistisches Modell, das auf Tausende von Sätzen aus dem Wall Street Journal trainiert wird. Es kann durch Faktoren beeinflusst werden, wie beispielsweise, welche Zeichenfolgen in dem Wort erscheinen und welche Wörter das Wort in dem Satz umgeben.

Es gibt weitere Details hier: https://nlp.stanford.edu/software/tagger.shtml

Verwandte Themen