Ich versuche, ein NLP-System für eine Zuordnung zu erstellen, für die ich externe Bibliotheken verwenden darf.
Ich benutze Parse Bäume, um Sätze in ihre Bestandteile bis Substantive, Verben usw. zu zerlegen.
Ich bin auf der Suche nach einer Bibliothek oder Software, die mich identifizieren würde, welche lexikalische Form ein Wort ist, und möglicherweise übersetzen zu einer anderen Form für mich.
Im Grunde brauche ich etwas mit Funktionen wie isPlural, singularize, getInfinitive, usw.
Ich habe das Ruby Linguistics-Paket und einen einfachen Porter Stemmer (für Infinitive) betrachtet, aber keiner ist sehr gut.
Dies scheint nicht ein sehr schweres Problem, nur sehr mühsam.
Kennt jemand ein gutes Paket/Bibliothek/Software, die solche Dinge tun könnte?NLP: Morphologische Manipulationen
1
A
Antwort
1
Um einen Syntaxbaum eines Satzes zu erstellen, muss man zuerst die Wortart- und Lemma-Information der Wörter im Satz bestimmen. Also, Sie sollten diese Informationen bereits haben.
Aber in jedem Fall, um Wortformen, um ihre Lemmata abzubilden und synthetisieren Wortformen aus Lemmata, werfen Sie einen Blick auf morpha
and morphg
, und auch die Java-Version (oder Front-End) morphg
im SimpleNLG package enthalten. Es gibt Verfahren wie getInfinitive
, getPastParticiple
usw. Siehe z.B. die API for the Verb class.
Verwandte Themen
- 1. Powershell: String-Manipulationen
- 2. Undo-Implementierung - DOM-Manipulationen
- 3. Manipulationen mit istream
- 4. Morphologische Wasserscheide von Markern Filter auf ITK
- 5. Leistung: binäre Bild erweitern (morphologische Dilatation)
- 6. Morphologische Trennung von zwei verbundenen Grenzen
- 7. C: String-Manipulationen und Arduino
- 8. DOM-Manipulationen und Modifikationen verhindern
- 9. Google Doc-Manipulationen mit .net
- 10. XML-Datei Interpretation und Manipulationen
- 11. bekommen Teilstring mit wenigen Manipulationen
- 12. NLP-Bibliothek in Java
- 13. NLP-Programmierwerkzeuge mit PHP?
- 14. c/C++ NLP-Bibliothek
- 15. NLP von Gesetzestexten?
- 16. Stanford NLP: Interpunktionsfehler Identifikation
- 17. stanford nlp Tokenizer
- 18. NLP/Machine Learning Textvergleich
- 19. WordNet-Code für NLP
- 20. NLP-POS Herausforderung
- 21. Stanford Kern NLP LexicalizedParser Modell
- 22. Stanford NLP - Angabe eines POS
- 23. Wie Stoppwörter mit Stanford nlp
- 24. Wie schützt man eine Geschwindigkeitsvorlage vor Manipulationen?
- 25. Doing diese Manipulationen in R effizienter
- 26. Get HTML Source nach JavaScript-Manipulationen
- 27. Rewrite Array-Manipulationen von C++ zu C#
- 28. Morphologische Operationen verschmelzen Linien mit Kanten von Bildern
- 29. NLP-Bibliothek für Java Programming Language
- 30. Stanford NLP gibt zurück: statt NNP
danke für das Erzählen mir von morpha .. ich fand ein ubuntu-Paket für es .. und das kann Infinitiv ziemlich easili .. noch müssen die Dokumente lesen, um herauszufinden, wie man es machen kann, die anderen Dinge .. –