2015-10-12 9 views
14

Ich muss am Ende ein bidirektionales LSTM-Netzwerk mit einer CRF-Schicht implementieren. Insbesondere das in diesem Papier vorgestellte Modell, und es zu trainieren.Implementierung eines bidirektionalen LSTM-CRF-Netzwerks

http://www.aclweb.org/anthology/P15-1109

Ich möchte sie vorzugsweise in Python implementieren. Kann jemand einige Bibliotheken oder Beispielcode präsentieren, wie dies getan werden kann. Ich schaute PyBrain an, konnte es aber nicht wirklich verstehen.

Ich bin auch offen für Tool-Kits in anderen Programmiersprachen.

+0

Haben Sie Ihre Arbeit abgeschlossen und reichen Sie sie beim GitHub ein? –

+2

https://github.com/chilynn/sequence-labeling –

Antwort

7

Hier ist eine Implementierung eines bidirektionalen LSTM + CRF-Netzwerks in TensorFlow: https://github.com/Franck-Dernoncourt/NeuroNER (funktioniert unter Linux/Mac/Windows).

Sie erhalten aktuelle Ergebnisse zu Erkennungsdatensätzen für benannte Entitäten.

ANN Architektur (es nutzt auch Charakter Einbettungen):

enter image description here

Wie in TensorBoard angesehen:

enter image description here

Sie können auch das Wort Einbettungen visualisieren:

enter image description here

+0

wo ist das CRF in dieser Implementierung? – Martian2049

+0

@ Matian2049 obersten Schicht in der ANN. –

0

Es ist eine Weile her, seit du gefragt hast, aber jetzt würde ich vorschlagen, anago zu verwenden. Anago ist in Keras gebaut und Sie können den Quellcode sehen, wenn Sie die Architektur schneiden müssen. https://github.com/Hironsan/anago

Verwandte Themen