2010-09-01 16 views
9

In letzter Zeit habe ich viel über MapReduce/Hadoop gelesen und denke, dass dies der Punkt ist, an dem sich die Industrie derzeit bewegt. Ich möchte lernen MapReduce/Hadoop und ich dachte, der beste Weg zu starten wäre, ein kleines Projekt zu implementieren. Allerdings habe ich versucht, etwas zu googeln, aber konnte nichts finden.Erste Schritte mit MapReduce/Hadoop

Könnt ihr mir ein paar Links oder können einige Bücher, die mir eine praktische Einführung dieser Technologie geben kann. Kann ein kleines Projekt sein, das ich selbst implementieren kann, um ein besseres Verständnis der Technologie zu bekommen.

Danke, Chander

Antwort

3

Die häufigsten Beispiele, die sich um einen invertierten Index erstellen, und die Umsetzung grep geworfen bekommen.

Wenn Sie sich für weitere Informationen suchen:

Eine wirklich freundliche Einführung here. Das ursprüngliche Papier ist here.

gefunden werden kann und was wie ein gutes Beispiel-Code sieht Sie gehend zu erhalten ist here.

+0

Sorry, aber der Link aus irgendeinem Grund gebrochen. Kannst du das Reparieren? – Nabin

+0

Link zum ursprünglichen MapReduce-Papier: http://research.google.com/archive/mapreduce.html – maxteneff

5

Cloudera (releases eine Hadoop Distribution) hat einige fantastische Online-Trainingsvideos sowie eine virtuelle Maschine (Sie können von diesem zu einigen mehr folgen) Setup und in der Lage, durch Beispiele aus dem Online-freien Training mit MapReduce http://www.cloudera.com/resources/?type=Training

2

Here sind ein paar netten Artikel/Videos/Tutorials auf dem ersten Schritte zu laufen.

2

Der Versuch, über Hadoop zu springen, ohne MapReduce zu verstehen, kann schmerzhaft sein. Ich denke, der einfachste Weg, den Hammer zu verstehen, ist, einen Nagel zu sehen. :) Ich schrieb einen Blog-Artikel (Intro to Parallel Processing with MapReduce), wo ich ein gemeinsames Problem beschreiben und zeigen, wie es zu lösen mit und ohne MapReduce. Dann zeige ich, wie MapReduce es einfach macht, die Arbeit auf einem Cluster zu verteilen.