Ich verstehe, dass das Ausführen von Nutch im Bereitstellungsmodus ein verteiltes Crawlen basierend auf Hadoop ist, aber ich konnte nicht vollständig verstehen, was passiert, wenn wir es im lokalen Modus ausführen. Ist Nutch in diesem Fall unabhängig von Hadoop? Und basiert der Crawling-Prozess im lokalen Modus nicht auf MapReduce?Ist Nutch im lokalen Modus unabhängig von Hadoop?
0
A
Antwort
2
Nutch basiert auf MapReduce, unabhängig davon, wie es läuft. Die Hadoop-Bibliotheken sind Abhängigkeiten von Nutch. Im lokalen Modus setzt Nutch die Hadoop-verwandten Bibliotheken auf den Klassenpfad und führt sie alle in einer einzigen JVM aus. Im verteilten Modus wird der Befehl 'hadoop' aufgerufen.
Siehe Nutch script
PS: Wenn Sie Nutch auf einer einzigen Maschine zu verwenden, macht es Sinn, sie in Pseudo verteilten Modus zu laufen, so dass Sie die MapReduce UI bekommen das Crawling zu überwachen + Parallelität etc ...
Verwandte Themen
- 1. Arbeiten von Nutch Server im verteilten Modus
- 2. Funke im lokalen Modus ausführen
- 3. SafeModeException: Name Knoten ist im abgesicherten Modus
- 4. Hadoop-Shutdown, wie Hadoop im pseudo-verteilten Modus zu stoppen?
- 5. Apache Nutch Neustart Crawl
- 6. Spring Cloud-Konfiguration im lokalen Dev-Modus
- 7. SparkContext.addJar funktioniert nicht im lokalen Modus
- 8. lesen Haar Kaskade im verteilen Modus in hadoop
- 9. Wie kopiert man Hadoop-Beispiele von lokalen in Hadoop-Umgebung?
- 10. Das Ausführen von Oozie im lokalen Modus gibt den Fehler
- 11. im Cluster-Modus DistributedCached Verwenden von
- 12. Ausführen von Kdiff3-Befehl im unbeaufsichtigten Modus
- 13. Spark-Ausnahme, wenn offizielles Beispiel im freien hadoop Modus
- 14. Spark 1.6.0 Classcast Exception werfen im Cluster-Modus funktioniert gut im lokalen Modus
- 15. nutch Feldproblem
- 16. ASP.NET ReportViewer Leistung im lokalen Modus (Ausdruck_Host-Regeneration)
- 17. hadoop Kopieren einer lokalen Datei in Hadoop SF Fehler
- 18. Distributed lokalen Clusterkoeffizient Algorithmus (MapReduce/Hadoop)
- 19. CXF JAX-RS-Client sendet immer leere PUT-Anfragen im Chunking-Modus unabhängig von AllowChunking
- 20. Was ist der Unterschied zwischen Spark Standalone, YARN und dem lokalen Modus?
- 21. SolrIndexer indexer failed nutch
- 22. Unterschied zwischen lokalen und Garn in hadoop
- 23. Hadoop-Upload-Dateien von der lokalen bis HDFS
- 24. Mit nutch in Windows 7
- 25. Ist WCF-Plattform unabhängig?
- 26. Verwenden von Aut0 im Popup-Modus
- 27. Apache Nutch schreiben crawled docs zu rabbitmq
- 28. Nutch und Elasticsearch
- 29. Nutch Multithreading
- 30. Ist moment.js Browser unabhängig?
Ok . Im lokalen Modus verwendet Nutch nur den MapReduce-Mechanismus von Hadoop und sonst nichts. Habe ich recht? –
"alles andere" -> HDFS? Es wird nicht standardmäßig verwendet. Sprechen wir über Nutch 1.x BTW? –
Ja, ich arbeite mit 1.12. Wie verwende ich HDFS im Standalone-Modus? –