Wie man neue Etiketten in NLTK für Name Entity Anerkennung trainieren

Ich bin neu in Python Ich muss einen Job Titel aus dem Text zu extrahieren und ich muss wissen, wie man Daten für Name Entity Erkennung und wo die Daten zu trainierenWie man neue Etiketten in NLTK für Name Entity Anerkennung trainieren

Quelle

2016-07-14 Balaji D

Ich glaube, Sie zuerst nach Tutorials suchen soll und experimentieren selbst starten. Wir werden Ihnen bei Problemen in Ihrem Code helfen, aber wir werden den Code _for you_ nicht schreiben. BTW –

, hier ist ein regelbasierte NER, sehr albern, aber Spaß =) https://gist.github.com/alvations/73bce71acf229265bc08 – alvas

Um ein Named-Entity Recognizer oder andere chunker mit benutzerdefinierten Kategorien (einschließlich Berufsbezeichnungen) zu trainieren, benötigen Sie einen Korpus, der mit den Kategorien kommentierten werden Sie interessiert sind. Dann können Sie das nltk Buch lesen, insbesondere Kapitel 7.2 auf chunking, die zeigt Ihnen, wie man einen Chunker mit dem Nltk trainiert.

Quelle

2016-07-18 19:59:21 alexis

danke ich habe –

Gut zu hören, dass. Also, was ist deine Frage jetzt genau? – alexis

das Problem, das ich hatte, ist, dass wir hatten eine große Menge wieder i Stellenbezeichnungen für zB extrahieren müssen: Schullehrer, Software-Entwickler ... ich habe diese Hilfe ur tq –

Wie man neue Etiketten in NLTK für Name Entity Anerkennung trainieren

Antwort

Verwandte Themen