2010-05-12 7 views

Antwort

9

Vielleicht können Sie zuerst etwas zu MapReduce und verteiltes Computing lesen, um es besser zu verstehen. Hier sind einige Ich mag würde empfehlen:

Auf der anderen Seite, wenn Sie sich besser von Hadoop wissen wollen, vielleicht können Sie Hadoop MapReduce Framework Quellcode zu lesen beginnen.

3

Derzeit Bookwise würde ich auschecken - Hadoop A Definitive Guide. Es ist geschrieben von Tom White, der schon eine ganze Weile an Hadoop gearbeitet hat und arbeitet bei Cloudera mit Doug Cutting (Hadoop Creator).

Auch auf der freien Seite hat Jimmy Lin von UMD ein Buch geschrieben: Data-Intensive Text Processing with MapReduce. Hier ist ein Link zum letzten Pre-Production-Verison (Link vom Autor auf seiner website zur Verfügung gestellt).

1

Das All Things Hadoop Podcast http://allthingshadoop.com/podcast hat einige gute Inhalte und gute Gäste. Viele davon sind darauf ausgerichtet, mit Distributed Computing zu beginnen.

1

MIT 6.824 ist das beste Zeug. Nur das Lesen von Google-Papieren zu Hadoop reicht nicht aus. Ein systematisches Kurslernen ist erforderlich, wenn Sie tiefer gehen wollen.

2

Hadoop ist nicht unbedingt das beste Werkzeug für alle verteilten Computerprobleme. Trotz seiner Macht hat es auch eine ziemlich steile Lernkurve und Betriebskosten. Sie könnten Ihre Anforderungen klären und nach geeigneten Alternativen in der Java-Welt suchen, wie HTCondor, JPPF oder GridGain (ich entschuldige mich für die, die ich nicht erwähne).

1

Wenn Sie eine verteilte Computing-Plattform erlernen möchten, die weniger kompliziert ist als Hadoop, können Sie Zillabyte ausprobieren. Sie müssen nur etwas Ruby oder Python kennen, um Apps auf der Plattform zu erstellen.

Wie LoLo gesagt hat, ist Hadoop eine leistungsstarke Lösung, aber kann zu Beginn schwierig sein.

Wenn Sie mehr über verteilte Berechnungen erfahren möchten, versuchen Sie es mit http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-824-distributed-computer-systems-engineering-spring-2006/syllabus/. Es gibt mehrere Ressourcen, die vom Kurs empfohlen werden.

Verwandte Themen