JackRabbit: textFilterClasses ist veraltet. Wie man Extraktoren spezifiziert?

Mein Hase 2.4 sagt, dass textFilterClasses Parameter von Suchindex Element ist veraltet und wird ignoriert. Wenn ich den textFilterClasses Parameter alle zusammen entferne, indexiert es Pdf, Rtf - alles.JackRabbit: textFilterClasses ist veraltet. Wie man Extraktoren spezifiziert?

Woher weiß es, welche binären Dateien es indizieren sollte, wenn ich keine Extraktoren spezifiziere?

API sagt, es ist veraltet, bietet aber keine Alternative.

Vielen Dank!

Quelle

2012-04-04 RobSis

Mit Jackrabbit 2.x wurde Apache Tika als Standard-Binärparser eingeführt. Standardmäßig wird Jackrabbit mit einer Standarddatei tika-config.xml geliefert, die die Konfiguration enthält, für die Mime-Typen analysiert und extrahiert werden.

In Jackrabbit 2.4 sollten Sie den Speicherort der Tika-config.xml aus der Repository.xml festlegen können.

<SearchIndex class="org.apache.jackrabbit.core.query.lucene.SearchIndex"> 
    <param name="path" value="${wsp.home}/index"/> 
    <param name="supportHighlighting" value="true"/> 
    <param name="tikaConfigPath" value="${wsp.home}/tika-config.xml"/> 
</SearchIndex>

sollten die richtigen Parameter in Ihrer Suchindex Konfiguration etwas ähnlich sein

Quelle

2012-04-18 13:53:48 Jeroen

JackRabbit: textFilterClasses ist veraltet. Wie man Extraktoren spezifiziert?

Antwort

Verwandte Themen