-1
Ich bin an der Suche nach bestimmten Sätzen mit einem Wortpaar aus Wikipedia dump interessiert. Ein Ansatz besteht darin, alle Dokumente nach dem Extrahieren der Dump-XML zu durchlaufen. Gibt es eine bessere Lösung?Was ist der beste Weg, um Text von der Wikipedia-Dump in Java zu suchen?
Vielleicht könnten Sie einige Suchmaschinen wie Lucene versuchen. – zhh