2013-07-12 12 views
5

Ich habe diese drei Dateien in einem Ordner und sie sind alle auf einen Index von Lucene erstellt bezogen werden:Verständnis lucene Segmente

  • _0.cfs
  • segments_2
  • segments.gen

Was sie alle für verwendet, und ist es möglich, ein bisschen mehr darüber, wie lucene arbeitet mit seiner Indizes zu erkennen, einen von ihnen zu einem für Menschen lesbaren Format zu konvertieren?

Antwort

6

Die beiden Segmente Dateien speichern Informationen über die Segmente und die .cfs ist eine Verbindung Datei anderer Indexdateien aus (wie Index, Speicherung, Löschung usw. Dateien).

Zur Dokumentation der verschiedenen Arten von Dateien verwendet, um einen Lucene Index zu erstellen, finden Sie in diesem summary of file extensions

Generell nein, Lucene Dateien lesbar nicht menschlich sind. Sie sind mehr Effizienz und Geschwindigkeit ausgelegt als die menschliche Lesbarkeit. Die Art und Weise einen Menschen lesbaren Format zu bekommen, ist sie durch die Lucene-API für den Zugriff (via Luke oder Solr, oder so ähnlich).

Wenn Sie ein gründliches Verständnis der Dateiformate verwendet wollen, würde die codecs package der Ort sein, zu suchen.