2017-06-23 1 views
1

Ich arbeite an einem NLP-Projekt und ich brauche die folgende Funktionalität, die durch ein Beispiel veranschaulicht wird. Sprich, es gibt einen SatzBeziehungen zwischen Pronomen und Substantiven in Sätzen finden

Sag Sam, dass er ohne Arthur gehen muss, da er krank ist.

In dieser Erklärung hat die erste he zu Sam und die zweite he Arthur getaggt werden. Ich arbeite in Python. Irgendwelche Vorschläge, was ich verwenden kann, um die folgende Funktionalität zu erhalten?

+0

Fordern Sie Sie Code hinzufügen, die Sie versucht haben. –

+0

Ich habe noch keinen Code geschrieben, da ich nicht genau verstehe, was ich benutzen muss. Ich habe Nltk-Chunkers betrachtet, um zu versuchen, Pronomen mit Substantiven zu gruppieren, indem der reguläre Ausdruck <*> verwendet wird, der einem Substantiv gefolgt von einem Pronomen entspricht. Aber das wird nicht in allen Fällen funktionieren. –

Antwort

2

Diese Aufgabe wird Coreference-Auflösung genannt. Um komplexe Fälle wie den von Ihnen erwähnten zu analysieren, müssen Sie ein Korreferenz-Auflösungssystem verwenden, von denen die meisten (free/OOS) in Java entwickelt werden. Es gibt mehrere Möglichkeiten, sie einfach in Python zu verwenden. Einer der bekanntesten ist dieser Standford CoreNLP-Wrapper: https://github.com/dasmith/stanford-corenlp-python

Verwandte Themen