Ich möchte NER (CRF-Klassifikator) verwenden, um Autornamen in einer Abfrage zu identifizieren. Ich trainierte NER nach der in nlp.stanford.edu angegebenen Methode mit der Trainingsdatei: training-data.col. Und getestet mit der Datei: testing-data.tsv.Schulung eines NER-Klassifikators zum Erkennen von Autornamen
Der NER markiert jeden Eingang als Autor, auch die Daten, die in den Trainingsdaten als Nicht-Autor markiert sind. Kann mir jemand sagen, warum NER die Nicht-Autoren in Trainingsdaten als Autoren markiert und wie man NER trainiert, um Autoren zu identifizieren (ich habe die Liste der Autornamen zu trainieren).
Alle Vorschläge für Referenzmaterial auf NER außer nlp.stanford.edu Website wird hilfreich sein.