PDFBox API funktioniert gut für weniger Anzahl von Dateien. Aber ich muss 10000 pdf-Dateien zu einem verschmelzen, und wenn ich 10000 Akten (ungefähr 5gb) übergebe, nimmt es 5gb RAM und schließlich geht der Speicher aus. Gibt es eine Implementierung für solche Anforderungen in PDFBox? Ich habe versucht, es zu tunen, dass ich AutoClosedInputStream verwendet, die automatisch nach dem Lesen geschlossen wird, aber Ausgabe ist immer noch gleich.Wie 10000 pdf zu einem mit pdfbox in der effektivsten Art und Weise verschmelzen
0
A
Antwort
1
Ich habe ein ähnliches Szenario hier, aber ich muss nur 1000 Dokumente in einem einzigen zusammenführen.
Ich habe versucht, PDFMergerUtility
Klasse zu verwenden, aber ich bekomme eine OutOfMemoryError
. Also habe ich meinen Code überarbeitet, um das Dokument zu lesen, lade die erste Seite (meine Quelldokumente haben nur eine Seite) und füge dann statt PDFMergerUtility ein. Und jetzt funktioniert es gut, ohne OutOfMemoryError
.
public void merge(final List<Path> sources, final Path target) {
final int firstPage = 0;
try (PDDocument doc = new PDDocument()) {
for (final Path source : sources) {
try (final PDDocument sdoc = PDDocument.load(source.toFile(), setupTempFileOnly())) {
final PDPage spage = sdoc.getPage(firstPage);
doc.importPage(spage);
}
}
doc.save(target.toAbsolutePath().toString());
} catch (final IOException e) {
throw new IllegalStateException(e);
}
}
Verwandte Themen
- 1. Pdf-Dateien mit PDFBox verschmelzen
- 2. PDF-Dateien mit PDFBox über CLI verschmelzen
- 3. PDF mit PDFBox schützen
- 4. PDFBox: versuchen, PDF zu entschlüsseln
- 5. PDF-Inhalt mit PDFBox verschieben
- 6. PDF-Seite mit pdfbox bearbeiten
- 7. Wie pdf in Java mit pdfbox zu signieren
- 8. Mit PdfBox drucken, PDF im Browser rendern
- 9. PDF-Dateien mit PHP verschmelzen
- 10. $ resource in AngularJS in der richtigen Art und Weise mit
- 11. effiziente Art und Weise von
- 12. Bevorzugte Art und Weise in Webpack Bootstrap der Verwendung
- 13. PDF-Formular füllen mit PDFBox funktioniert nicht
- 14. pdfbox manipulieren pdf dokument - android
- 15. BoundingBox Art und Weise der Anzeigeinformation
- 16. bessere Art und Weise einfachen Performance-Tests
- 17. TIFF aus PDF extrahieren mit PDFBox v2
- 18. beste Art und Weise Benutzerberechtigungen mit PHP
- 19. Art und Weise zu ignorieren Zertifikat ssl mit HttpsURLConnection
- 20. Scala sichere Art und Weise String zu Aufzählungswert der Umwandlung
- 21. Java: Jede Art und Weise einen String-Eingang in pdf zu speichern
- 22. Wie man einen Hyperlink in pdf mit pdfbox hinzufügt
- 23. beste Art und Weise Passwort speichern in der Datenbank
- 24. elegante Art und Weise Spaltenreihenfolge
- 25. korrekte Art und Weise jQuery mit require.js zu implementieren
- 26. Erstellen CRUD ein mehrteiliges PDF-Dokument mit PDFBox (PDF-Generierung) und Wartung in MongoDB
- 27. Schnelle Art und Weise alle Buchstaben in einem hashmap
- 28. schnellste Art und Weise erste Großbuchstaben in einem String
- 29. Wie log4j Bibliothek am effektivsten
- 30. Seitenzahlen mit PDFBox hinzufügen