2016-07-14 2 views
0

Ich bin neu in Python Ich muss einen Job Titel aus dem Text zu extrahieren und ich muss wissen, wie man Daten für Name Entity Erkennung und wo die Daten zu trainierenWie man neue Etiketten in NLTK für Name Entity Anerkennung trainieren

+0

Ich glaube, Sie zuerst nach Tutorials suchen soll und experimentieren selbst starten. Wir werden Ihnen bei Problemen in Ihrem Code helfen, aber wir werden den Code _for you_ nicht schreiben. BTW –

+0

, hier ist ein regelbasierte NER, sehr albern, aber Spaß =) https://gist.github.com/alvations/73bce71acf229265bc08 – alvas

Antwort

0

Um ein Named-Entity Recognizer oder andere chunker mit benutzerdefinierten Kategorien (einschließlich Berufsbezeichnungen) zu trainieren, benötigen Sie einen Korpus, der mit den Kategorien kommentierten werden Sie interessiert sind. Dann können Sie das nltk Buch lesen, insbesondere Kapitel 7.2 auf chunking, die zeigt Ihnen, wie man einen Chunker mit dem Nltk trainiert.

+0

danke ich habe –

+0

Gut zu hören, dass. Also, was ist deine Frage jetzt genau? – alexis

+0

das Problem, das ich hatte, ist, dass wir hatten eine große Menge wieder i Stellenbezeichnungen für zB extrahieren müssen: Schullehrer, Software-Entwickler ... ich habe diese Hilfe ur tq –

Verwandte Themen