2016-03-16 5 views

Antwort

0

NER-Lösungen sind in der Regel domänenspezifisch und verwenden entweder fest codierte Wortlisten als Signale (Features) und/oder interne Buchstabenstruktur der benannten Entitäten.

Die Namen von UK/USA ähneln sich untereinander und auch mit anderen europäischen Namen, da viele populäre USA Namen und Familiennamen von nicht-englischen europäischen Einwanderern stammen. Indische Namen unterscheiden sich signifikant, und häufig verwendete Listen von Namen/Nachnamen und Trainingsdatenkorpora enthalten im Allgemeinen keine oder nur sehr wenige indianische Daten.

Um Ihr Problem zu lösen, müssten Sie ein spezialisiertes NER-Modell basierend auf Daten, die für Ihre spezielle Domäne geeignet sind, trainieren.

+0

Gibt es eine andere Option für anerkannte indische Namen Entität? mag andere Opensource-Tools usw. .. @peteris –