2016-05-28 7 views
-1

Wir haben eine 3.000-seitige PDF-Datei und möchten Seiten basierend auf einem Muster entfernen.Perl-Skript zum Entfernen von Seiten aus einer PDF-Datei basierend auf Muster

Zum Beispiel Seiten, die nicht im PDF gefunden wurden, haben 50 Seiten. Die Ausgabe erfolgt nun auf 2.950 Seiten, indem 50 Seiten aus dem Dokument entfernt werden.

+0

Ich verstehe nicht * "pagenot im PDF haben 50 Seiten gefunden" *. Bitte erläutern Sie – Borodin

+0

Ich denke, "Pagenot gefunden" ist der Inhalt/Text auf der PDF-Datei. Darf ich korrigieren? – ssr1012

Antwort

1

Könnten Sie bitte versuchen Sie dies:

use strict; 
use warnings; 
use CAM::PDF; 

my $pdf = CAM::PDF->new('input.pdf'); 
my $ttl_pgs = $pdf->numPages(); 

for(1..$ttl_pgs) 
{ 
    my $pagnum = $_; 
    my $pdf_cnt = $pdf->getPageContent($pagnum); 
    if($pdf_cnt=~m/pages not found/i) 
    { 
     $pdf->deletePage($pagnum); 
    } 
} 
$pdf->cleanoutput('output.pdf'); 
Verwandte Themen