2016-05-06 12 views
0

Ich arbeite derzeit mit PDF-Bildextraktion auf python3.Ermitteln JPEG-Farbkodierung

Ich habe die Kernlogik abgeschlossen und es funktioniert ganz gut.

Das Problem ist, manchmal YCCK-kodierte JPG-Datei kommt aus PDF, und es sieht schrecklich mit gängigen Bildbetrachter.

Ich kann YCCK-Bild in CMYK konvertieren, aber ich kann nicht herausfinden, wissen, wie zu bestimmen, ob das Bild YCCK, CMYK oder YUV ist.

Wenn ich jedes Bild von YCCK in CMYK umwandel, wird es CMYK- und YUV-Bilder brechen.

Ich habe einige Stunden gesucht und nur this gefunden.

Der Artikel half sehr, aber ich kann Java API nicht verwenden.

Antwort

0

Um den verwendeten Farbraum zu bestimmen, müssen Sie die APPn-Blöcke im Stream analysieren, um das Dateiformat zu bestimmen: JFIF, SPIFF, EXIF, ADOBE, usw. Wenn Sie es aus einem PDF holen Dateien sind wahrscheinlich im ADOBE-Format. Sie müssen ihre Dokumentation überprüfen, wie sie die APPn-Blöcke verwenden. Hier

ist eine Seite, die eine Zusammenfassung hat:

http://www.sno.phy.queensu.ca/~phil/exiftool/TagNames/JPEG.html#Adobe