2010-11-29 6 views

Antwort

0

Wie groß ein Bild redest du da? Aus der JPEG 2000 Wikipedia page scheint es, dass die Kachel- und Wavelet-Transformationen leicht parallelisierbar sein sollten - die Kacheln scheinen voneinander unabhängig zu sein. Es gibt eine Open-Source-Bibliothek namens JasPer, die anscheinend ziemlich weit verbreitet ist, aber sie ist in C geschrieben, was die Integration in Hadoop etwas kompliziert macht.

Sie werden im Wesentlichen den Codec aus trennen müssen und ruft die entsprechenden Kacheln und ecoding Funktionen in der Karte Schritt und der reassemble und schreiben Sie das Bild im Schritt reduzieren. Es wird wahrscheinlich ein ziemlich tiefes Verständnis des JPEG 2000-Formats selbst erfordern.

Die Frage ist: wie viel Zeit verbringen Sie die unkomprimierten Daten bewegen und dann das Wiederzusammensetzen im Vergleich zu den Fliesen Verarbeitung seriell auf einer einzigen Maschine? Vielleicht möchten Sie die Berechnung der Hüllkurve etwas zurücknehmen, um zu sehen, ob es sich lohnt und was die theoretische Beschleunigung verglichen mit der Ausführung auf einer einzelnen Maschine wäre.

+0

Die Bildgröße beträgt etwa 1 TB + und auf einem einzelnen Computer dauert es 100 Stunden + – portoalet