2017-08-06 1 views
1

Ich hätte gerne Hilfe, um Lucene in meiner Java App zu verwenden, um einen Text zu vereinfachen.Lucene librairy für die Reinigung eines Textes (plurial, verbs ...)

Ich habe es schon selbst gemacht, aber ich habe keine Lösung für Verben und plurial.

Wie kann ich verarbeiten?

+0

Bitte erstellen [Minimal, Complete, und prüfbare Beispiel] (http://stackoverflow.com/help/mcve) Wie wäre es mit dem Testen von SMS und Teilen eines Codes? –

+0

Es ist etwas klar, was Sie fragen. Aber bitte gehen Sie und lesen Sie den Link, der durch den obigen Kommentar zur Verfügung gestellt wurde. Wir helfen Ihnen nicht, ** Code ** zu schreiben, aber wir können Ihnen helfen, ** spezifisches Problem zu lösen **. – Blasanka

Antwort

0

Wenn ich Ihre Frage richtig verstehe, möchten Sie Nomen/Verb aus einem Text erkennen. AFAIK Lucene allein hat keine Fähigkeit, dies zu erkennen. Sie können stattdessen auf OpenNLP Bibliothek suchen, die eine Lern ​​

Maschine basierte Toolkit für die Verarbeitung natürlicher Sprache ist Text

So wäre es wie Trainingsmodelle unter Verwendung von Konzepten und die Vorhersage dann. Es hat eine POSTagger API (Teil der Rede Tagger) - Sie können einen Blick auf seine Verwendung here in der Dokumentation und einige detaillierte Beispiele here, here und here.

Ein weiterer hervorragender Rahmen in Java ist Stanford Core NLP Sie einen Blick auf Stanford nehmen können Lügt-lineare Part-Of-Speech Taggerhere

Verwandte Themen