2017-07-09 2 views
1

Ich bin verwirrt, was genau eine CRF-Implementierung einer linearen Kette ist. Während einige Leute sagen, dass "das lineare Ketten-CRF die Merkmale davon abhän- gt, nur von der aktuellen (i) und vorherigen Bezeichnung (i-1) und nicht von willkürlichen Beschriftungen im ganzen Satz abzuhängen", sagen einige Leute, dass es die Abhängigkeit der Merkmale einschränkt auf dem aktuellen (i) und zukünftigen Label (i + 1).Lineares kettenbedingtes Zufallsfeldsequenzmodell - NER

Ich versuche zu verstehen, die Umsetzung, die hinter dem Stanford NER-Modell geht. Kann jemand bitte erklären, was genau das lineare Ketten-CRF-Modell ist?

Antwort

3

Beide Modelle würden CRF-Modelle mit linearer Kette sein. Der wichtige Teil der "linearen Kette" ist, dass die Merkmale nur vom aktuellen Label und einem direkten Nachbarn in der Sequenz abhängen. Normalerweise wäre dies das vorherige Label (weil das der Lesereihenfolge entspricht), aber es könnte auch das zukünftige Label sein. Solch ein Modellmodell würde den Satz im Grunde rückwärts verarbeiten, und ich habe das nie in der Literatur gesehen, aber es wäre immer noch eine lineare CRF-Kette.

Soweit ich weiß, basiert das Stanford NER-Modell auf einem Modell, das das aktuelle und das vorherige Etikett verwendet, aber es verwendet auch eine Erweiterung, die auch auf Etiketten weiter hinten aussehen kann. Es ist daher kein strenges Linearkettenmodell, sondern verwendet eine Erweiterung, die in diesem Dokument beschrieben ist:

Jenny Rose Finkel, Trond Grenager und Christopher Manning. 2005. Einbeziehung von nicht-lokalen Informationen in Information Extraction Systems durch Gibbs Sampling. Tagungsband der 43. Jahrestagung der Vereinigung für Computerlinguistik (ACL 2005), S. 363-370.

+0

Vielen Dank für die Hinweise! – Gayatri