Ich habe einen Text, den ich die Nominalphrasen daraus extrahieren möchte. Ich kann leicht den getippten Parser für den Text erhalten, den ich habe, aber mich wundernd, wie ich die Nominalphrasen im Text extrahieren kann?Extrahieren von Nominalphrasen aus einer Textdatei mit Stanford typisierten Parser
Antwort
Sie können Stanford Core NLP für das POS-Tagging verwenden. Sie können einen Beispielcode unter http://nlp.stanford.edu/software/corenlp.shtml#Usage finden, der ein guter Ausgangspunkt für Experimente sein könnte. Sie müssten Tokenize, Split und Pos als Eigenschaften angeben. Dies gibt eine Liste von Token mit ihren entsprechenden Tags aus.
Die gesamte Tag-Liste kann unter http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html angezeigt werden. Alle Nomen-Tags würden mit NN beginnen. Wenn Sie diese Prüfung durchführen, erhalten Sie die erforderlichen Token.
Versuchen Sie diese link auch. Ich bin mir nicht sicher, ob der Stanford POS-Tagger und der Tagger im corenlp identisch sind oder nicht, aber ich fand diesen Link nützlicher.
Nach dem PoS-Tagging müssen Sie Muster wie diese erkennen (Adjektiv | Substantiv) * (Substantiv)? (Adjektiv | Nomen) * Nomen
Probieren Sie diese link für einige Details zur Erkennung der Substantivphrase.
Sie können Nominalphrasen aus Tree extrahieren, indem Sie den folgenden Code verwenden. Es wird davon ausgegangen Sie Satz in Parse gespeichert analysiert haben (das heißt Parse ausgegeben von LexicalizedParser Klasse gelten Methode)
public static List<Tree> GetNounPhrases()
{
List<Tree> phraseList=new ArrayList<Tree>();
for (Tree subtree: parse)
{
if(subtree.label().value().equals("NP"))
{
phraseList.add(subtree);
System.out.println(subtree);
}
}
return phraseList;
}
- 1. Verwenden von Stanford Parser (CoreNLP), um Satzköpfe zu finden
- 2. Extrahieren von Daten aus Zeilen einer Textdatei
- 3. Extrahieren von Token aus einer Textdatei?
- 4. Extrahieren von Spalten aus Textdatei mit Powershell
- 5. Stanford Parser Tags
- 6. Zeilen aus Textdatei extrahieren
- 7. Nummer aus einer formatierten Textdatei extrahieren Java
- 8. Extrahieren von benutzerdefinierten Tags aus Textdatei
- 9. Verwendung von Stanford Parser im Web-Service
- 10. Wie Stanford Parser zu verwenden
- 11. Extrahieren von Begriffen mit Kontextrelevanz (Nominalphrasen) aus Text in einem .NET-Projekt
- 12. Extrahieren von wiederholten Mustern aus einer Textdatei in Python
- 13. Extrahieren aller Nomen aus einer Textdatei mit Nltk
- 14. Extrahieren einer Zeichenfolge aus einer Textdatei in Python 2.7.5
- 15. Maven Build für Stanford CoreNLP und Stanford Parser
- 16. Wie man Interpunktion im Stanford Abhängigkeit Parser
- 17. Stanford-Parser kann keine deutschen Umlaute lesen
- 18. Stanford Dependency Parser - Wie bekomme ich Phrasenvektoren?
- 19. Wie bekomme ich POS-Tagging mit Stanford Parser?
- 20. PL/SQL extrahieren Spalten aus der Textdatei
- 21. Stanford Parser - Verwenden Sie Deutsch Modell Glas
- 22. Daten aus einer Textdatei in eine Ausgabedatei extrahieren
- 23. Nummer aus einer Textdatei in C# Windows-Formular extrahieren
- 24. Extrahieren von Zahlen in Textdatei
- 25. So extrahieren Sie die Zahlen aus einer Textdatei
- 26. Erster Urtext nach der Verwendung von Stanford NLP-Parser
- 27. Teil einer Textdatei in BAT extrahieren
- 28. Extract Worte aus einer Textdatei
- 29. Identifizierung von Kataphora und Anaphora in Stanford Parser
- 30. Wie bekomme ich einen Abhängigkeitsbaum mit Stanford NLP Parser
Ich habe versucht, Stanford getippt Parser zu bekommen, aber immer noch Fragen, die die Nominalphrase repräsentiert Tags ist! –
U benötigen NLP-Tools. Überprüfen Sie diese Frage http://stackoverflow.com/questions/1889675/extract-nouns-from-text-java –
Warum verwenden Sie an erster Stelle einen Abhängigkeitsparser? Ein normaler Parse-Baum-Generator scheint so zu sein für das, was Sie wollen. –