2017-12-26 4 views
0

Wie wird die Tiefe für Apache-Nutch Crawler festgelegt?Einstellung der Tiefe für Apache-Nutch Crawler

Im Folgenden Befehl sagt Crawl veraltet:

bin/nutch crawl seed.txt -dir crawler/stat -depth 1 -topN 5 

ich mit bin/kriechen statt kriechen versucht. Dafür erhalte ich Fehler:

class cannot be loaded : bin.crawl

Antwort

0

Wenn Sie wirklich einstellen maximale Tiefe wollen, sollten Sie die Scoring-Tiefe-Plugin verwenden. Das Crawl-Skript ermöglicht es Ihnen, die Anzahl der Iterationen zu definieren. Dies ist eine Obergrenze für die Tiefe, aber nicht das Gleiche. Das richtige Format für den Crawl-Befehl lautet:

bin/crawl -s seed.txt crawler/stat 1 

Wie bei anderen Skripten Nutch, einfach laufen bin/kriechen ohne Parameter die Hilfemeldung zu sehen, die erklärt, wie es zu benutzen.