2013-11-15 9 views
11

mit php muss ich eine einzelne pdf-datei mit mehreren seiten darin in eine viel PDF-datei mit einer seite pro datei aufteilen. Ich benutze pdftk und funktioniert gut, aber jedes PDF erstellt für jede Seite ist sehr groß. Meine ursprüngliche PDF ist 7MB (mit 70 Seiten innerhalb), die Summe jeder Datei, die durch das Teilen mit pdftk erstellt wird, ist über 70MB.pdftk split pdf mit mehreren seiten

Jemand weiß, ob es eine Eigenschaft gibt, die für pdftk gesetzt wird, um eine kleine Dateiausgabe zu haben?

danke

+0

Eine sehr gute Lösung ist cloudinary für Split zu verwenden und PDF-Vorschau wie Bilder abrufen .. http://cloudinary.com –

Antwort

18

Sie immer die compress Option angeben könnten - zum Beispiel:

pdftk input.pdf burst output output_%02d.pdf compress 

Beachten Sie, dass pdftk nur kopiert den Inhalt von PDF-Dateien aus den Eingaben in die Ausgänge und kann nicht tue sehr viel, um Bloat zu optimieren. Wenn Ihre PDF-Eingabedateien groß oder kompliziert sind, werden Ihre PDF-Ausgabedateien ebenfalls angezeigt. Beachten Sie außerdem, dass alle in das Dokument eingebetteten Schriftarten möglicherweise in jedem Ausgabedokument dupliziert werden, wodurch mehr Platz beansprucht wird.

+0

ich versuche, es, aber nicht funktioniert :(Ich habe die gleiche Dateigröße –

+0

@ Simone, wie Pobrelkey ​​sagte, haben Sie möglicherweise gemeinsame Ressourcen in der ursprünglichen Datei, wie Schriftarten oder Hintergrundbild, die jetzt 70 mal dupliziert sind. Vielleicht eine einzelne Seite Probe wird jemandem helfen, Wege zur Optimierung vorzuschlagen.Und beachten Sie, 'pdftk' komprimiert nicht auf ein Maximum (mit 1.5 Features wie komprimierte Xref-Tabelle und Objekt-Streams, dachte, es wird natürlich keine 70-fache Komprimierung geben) – user2846289

+2

ok, ich versuche das und löste mein Problem : http://pandemoniumillusion.wordpress.com/2008/05/07/compress-a-pdf-with-pdftk/ –

5

Beim Teilen von PDF-Dateien ist es manchmal schwierig, Informationen zu vermeiden, die nur von einigen Seiten benötigt werden, die in jeder Ausgabedatei enthalten sind.

cpdf versucht hart, dies zu vermeiden - Sie können es versuchen und sehen, was passiert. Sie könnten finden, es ist nicht besser als pdftk auf Ihrer Datei, aber es sollte sein.

Offenlegung: Ich bin der Autor von cpdf.

7

können Sie pdftk verwenden und versuchen

pdftk source.pdf cat 1-100 output try1.pdf 
pdftk source.pdf cat 101-end output try2.pdf 
1

hatte ein ähnliches Problem. Aber gilt nicht 1: 1 auf die Frage. Auch immer jemand könnte es nützlich finden:

  1. Ich habe eine sehr große PDF-Datei hatte - original.pdf - von mehr als 240 MB. Es war fast unmöglich, es zu benutzen. Ich druckte es mit evince als pdf und entfernt jede Skalierung in der Druckereinrichtung. Dies erzeugte eine Datei - neu.pdf - von um 102MB! Offensichtlich wurden alle eingebetteten Schriftarten, Lesezeichen und so weiter entfernt.
  2. Um die Lesezeichen zurück zu bekommen, habe ich cpdf verwendet, um die Lesezeichen aus dem ursprünglichen PDF-Dokument zu extrahieren und es auf das neue zu übertragen. Das resultierende Dokument - result.pdf - ist einfach zu navigieren und sehr schnell in beliebigen PDF-Viewer.

Referenz: CPDF zu extrahieren und anwenden Lesezeichen: http://www.coherentpdf.com/cpdfmanual/node38.html

cpdf -list-bookmarks original.pdf > booksmarks.txt 
cpdf -add-bookmarks booksmarks.txt new.pdf -o result.pdf