2011-01-03 8 views
0

Ich habe eine Textdatei mit einer großen Anzahl von Wörtern (~ 50 MB). Um einen Index für diesen Dateiinhalt zu erstellen, welche Datenstruktur ist am besten geeignet?Implementieren eines Index für Textdatei Inhalt

Oder mit welcher Datenstruktur kann ich die besten Ergebnisse bei der Suche erzielen?

Vielen Dank im Voraus

Jijoy

+1

Es hilft normalerweise, wenn Sie mehr Details über die Dateistruktur angeben und was Sie suchen ... –

+0

Warum können Sie nicht einfach die Daten in einer Datenbank und lassen Sie das organisieren die Daten für die schnellsten Suchergebnisse (dh Indizes zu den Kriterien, nach denen Sie die Daten durchsuchen)? –

Antwort

4

Wenn Ihre Daten ein Wörterbuch von Wörtern ist, ist ein Trie gut geeignet.

0

A B + Baum wäre sehr effizient sein, wenn man sich wie ein Tisch davon dachten, aber wenn es einfach eine große Liste von Wörtern ist, könnte man Fibonacci-Bäume eine Chance geben .

2

können Sie den Aufwand für die Verwendung von Datenstrukturen und Schreiben unter Verwendung eines Algorithmus eine Bibliothek wie [lucene] [1]

[1] cut-off. Ich bin mir nicht sicher, ob es richtig ist, aber wenn man in Java Indexe für Dateien erstellen muss und einige Suchoperationen mit diesen Indizes durchführen muss, wird die Verwendung von Lucene als fair betrachtet.

+0

Lucene löste das einige ähnliche Problem für mich !!! –

Verwandte Themen