2017-10-05 1 views
0

Ich habe Apache Nutch 1.13 mit Solr 5.5.0 und Hbase 0.90.6 in Eclipse konfiguriert. Jetzt bin ich in der Lage, die Jobs von Injektor zu invertlinks auszuführen, aber während des Indexierungsjobs wird der Fehler "Missing elastic.cluster and elastic.host ...." ausgegeben. Ich habe indexer-solr unter plugin.includes in der Datei nutch-site.xml gesetzt. Aber immer noch diese Fehler zu bekommen. Kann mir jemand helfen, warum das passiert?Fehler "Missing elastic.cluster und elastic.host ...." beim Ausführen von Indexerjob in Nutch in Eclipse

Antwort

0

Das Problem ist mit der nutch-site.xml. Wenn Sie sehen, gibt es zwei nutch-site.xml; Einer befindet sich unter dem Ordner conf und der andere befindet sich im Ordner src/test. Im Allgemeinen konfigurieren wir die Datei nutch-site.xml im Ordner conf, aber wenn wir sie in eclipse importieren, wird diese Datei im Ordner src/test berücksichtigt. Um diesen Fehler zu beheben, konfigurieren Sie Ihre Einstellungen unter src/test folder. Im Allgemeinen diese Datei enthält sehr einfache Konfiguration, müssen Sie

<property> 
    <name>plugin.includes</name> 
    <value>.*</value> 
    <description>Enable all plugins during unit testing.</description> 
</property> 

mit folgenden Linien

<property> 
    <name>plugin.includes</name> 
    <value>protocol-http|urlfilter-regex|parse-(html|tika)|index-(basic|anchor)|indexer-solr|scoring-opic|urlnormalizer-(pass|regex|basic)</value> 
    <description>Regular expression naming plugin directory names to 
    include. Any plugin not matching this expression is excluded. 
    In any case you need at least include the nutch-extensionpoints plugin. By 
    default Nutch includes crawling just HTML and plain text via HTTP, 
    and basic indexing and search plugins. In order to use HTTPS please enable 
    protocol-httpclient, but be aware of possible intermittent problems with the 
    underlying commons-httpclient library. Set parsefilter-naivebayes for classification based focused crawler. 
    </description> 
</property> 

So ersetzen, wenn Sie verwenden verwenden möchten solr dann Indexer-solr, elastisch dann Indexer elastisch und so weiter .

Hoffe, dass diese anderen helfen.

Verwandte Themen