2012-07-26 8 views
5

Ich habe Solr gerade installiert und experimentiere jetzt, um zu lernen, wie man es benutzt. Ich möchte Solr Cell und langid Funktionen verwenden, also folgte ich den verknüpften Tutorials. Solr Cell funktioniert, aber ich kann gar nichts tun.Ich kann in Solr 4.0 keine Langid-Arbeit machen

In solrconfig.xml, ich habe dies:

<updateRequestProcessorChain name="langid"> 
    <processor class="org.apache.solr.update.processor.LangDetectLanguageIdentifierUpdateProcessorFactory"> 
    <str name="langid.fl">text,title,subject,description</str> 
    <str name="langid.langField">language_s</str> 
    <str name="langid.fallback">en</str> 
    <bool name="langid.map">true</bool> 
    </processor> 
    <processor class="solr.LogUpdateProcessorFactory" /> 
    <processor class="solr.RunUpdateProcessorFactory" /> 
</updateRequestProcessorChain> 

(ich auch mit Tika versucht), und ich sende ein Dokument mit

curl "http://localhost:8983/solr/update/extract?literal.id=test&commit=true" -F "[email protected]" 

Aber wenn ich frage, text:[* TO *] gibt mir mein Dokument zurück , aber text_en:[* TO *] nicht; language_s, selbst wenn ich es als gespeichert deklariere, ist stur abwesend; *:word findet nichts, obwohl es "words" gibt, also wird es nicht stemmed; und ich kann nichts im Log finden. Meine beste Vermutung ist, Langid läuft nicht, und ich habe keine Ahnung warum.

EDIT: Können Sie die Antwort: read more docs: p

Seit langid als Update-Anforderungsprozessor Kette konfiguriert ist, muss es ausgewählt werden (es ist nicht automatisch). Also, das funktioniert:

curl "http://localhost:8983/solr/update/extract?literal.id=test&commit=true&update.chain=langid" -F "[email protected]" 
+0

Danke für die Veröffentlichung, hatte die gleichen Probleme. P.S in meinem Fall (neueste SOLR) war die Update-URL-Durl = "http: // localhost: 8080/solr/update? Update.chain = langid –

Antwort

0

Konnten Sie die Antwort: read more docs: p

Seit langid als Update-Anforderungsprozessor Kette konfiguriert ist, muss es ausgewählt werden (es ist nicht automatisch). Also, das funktioniert:

curl "http://localhost:8983/solr/update/extract?literal.id=test&commit=true&update.chain=langid" -F "[email protected]" 
Verwandte Themen