Ich beginne mit einem Lucene-Index, den jemand anders erstellt hat. Ich möchte alle Wörter finden, die einem bestimmten Wort folgen. Ich habe den Begriff (org.apache.lucene.index.Term) von Interesse aus dem Index herausgezogen, und ich kann die Dokumente finden, die diesen Begriff enthalten:Wie bekomme ich den nächsten Begriff aus einem Lucene-Index?
segmentTermDocs = segmentReader.termDocs(term);
while (segmentTermDocs.next) {
doc = segmentReader.document(segmentTermDocs.doc);
...
}
Gibt es eine Möglichkeit für mich zu finden, die Positionen des Begriffs im Dokument und extrahieren die folgenden Begriffe?
Danke für die Ideen! Dies dient zum Generieren eines Berichts, daher ist die Leistung nicht wirklich ein Problem. Am Ende habe ich eine Brute-Force-Suche gemacht und PhraseQuerys erstellt, die aus dem Begriff des Interesses und jedem anderen Begriff im Index bestanden. Diejenigen Abfragen, die Treffer hatten, zeigten die Begriffe an, die dem Begriff von Interesse folgten. –