2016-09-30 10 views
0

Ich versuche die Stanford CoreNLP mit einer benutzerdefinierten NER-Wörterbuch-Map-Datei. Es ist ziemlich erfolgreich. Aber ich habe weiterhin Standard-NER-Entitäten wie DATE, NUMBER, die mein benutzerdefiniertes NER-Wörterbuch nicht enthält. Ist es möglich, es auszuschalten?Stanford CoreNLP Entfernen NUMBER Einheit

Beispiel: Toyota Altis 2.0 (in benutzerdefinierten NER Wörterbuch Map-Datei gefunden)

Stanford Ergebnis: Toyota: NER = Organisation, Altis: NER = FAHRZEUG 2.0: NER = NUMBER

Mein erwartetes Ergebnis: Toyota: NER = Organisation, Altis: NER = FAHRZEUG 2.0: NER = FAHRZEUG

gibt es irgendwelche Eigenschaften, was ich kann eingegeben sw itch it off entities DATE und NUMBER?

Vielen Dank im Voraus!

Antwort

1

Ich habe es geschafft, das Problem zu lösen. Um zu verhindern, Einheiten numerische und Datum im Zusammenhang, müssen Sie die folgenden Parameter in Ihrem Java-Code setzen:

props.put("ner.useSUTime","false");//do not load the default SUTime models from Stanford 
 
props.put("ner.applyNumericClassifiers","false");//do not use numeric from Stanford

Dank für das Betrachten.

Verwandte Themen