Ich habe ElasticMapReduce seit einiger Zeit verwendet. Es ist recht praktisch, aber ich kann HBase nicht ausführen, da der Hadoop-Cluster nur vorübergehend verfügbar ist (ich habe eine ähnliche Frage unter HBase and Hadoop gestellt).Hadoop auf EC2 vs. ElasticMapReduce/S3
Also ich möchte versuchen, Hadoop auf einer Reihe von EC2-Maschinen zu installieren. Ich weiß, dass Hadoop ein EC2 verwandtes Verzeichnis hat - src/contrib/ec2. Es sieht so aus, als könnte ein Hadoop-Cluster einfach durch Eingabe eines Befehls gestartet werden, und ich kann mich bei einem Master-Knoten anmelden, um Jobs usw. auszuführen. Bevor ich das versuche, würde ich gerne irgendwelche Fehler von Personen wissen, die dies benutzt haben. Vielen Dank!
Gute Frage, würde gerne einige Antworten zu sehen. Ich weiß, dass Elastic MapReduce S3 als Speicherplattform verwendet. Daher ist es in der Regel weniger effizient als Hadoop auf EC2, da es die Datenlokalisierungsoptimierung nicht wie bei HDFS verwenden kann (s3 läuft auf einem anderen System). – Christophe