2012-11-17 13 views
8

Ich habe angefangen mit Nutch und Solr zu arbeiten und ich habe ein Problem mit der Integration von Solr mit Nutch. Ich folgte diesem Tutorial: http://wiki.apache.org/nutch/NutchTutorial und nach der Verwendung: bin/nutch crawl urls -solr http://localhost:8983/solr/ -depth 3 -topN 5 nutch Nachricht zeigt:Fehler beim Indizieren in Solr-Daten durch Nutch

java.io.IOException: Job failed!

und solr zeigt:

SEVERE: org.apache.solr.common.SolrException: ERROR: [doc=http://nutch.apache.org/] unknown field 'host'

Ich dachte, dass der Grund könnte eine fehlende 'Gastgeber' Feld sein in die $ SOLR_HOME/example/solr/conf/schema.xml aber es ist da. Ich wäre sehr dankbar für Ihre Hilfe.

+3

Haben Sie das Nutch-Schema in SOLR kopiert? cp $ {NUTCH_RUNTIME_HOME} /conf/schema.xml $ {APACHE_SOLR_HOME}/Beispiel/solr/conf/ –

+0

ja, das habe ich kopiert. – user1831647

+2

Überprüfen Sie, ob der Host im Schema definiert ist. Stoppt Solr. Entfernen Sie das Datenverzeichnis. Starte Solr. Versuch es noch einmal. –

Antwort

2

Die Änderung der Konfiguration auf der nutch-Seite hat keinen Einfluss auf das Schema von Solr. Sie müssen dieses Feld in schema.xml von Solr definieren.