2017-03-08 3 views
0

Ich bin verpflichtet, die Kommentare und Lesezeichen von mehreren PDF-Dateien in meiner PHP-Anwendung zu analysieren. Gibt es eine Möglichkeit, diese Informationen zu extrahieren?Metadaten extrahieren wie Kommentare und Lesezeichen aus PDF mit PHP

Alles, was ich brauche, ist Lesezeichen Name + Hierarchie und Kommentare Inhalt + Koordinaten.

Ich würde eine PHP-Bibliothek bevorzugen, aber ich könnte auch zusätzliche Software auf dem Server installieren und es mit exec() aufrufen.

+0

Sie mehrere Bibliotheken, die den Trick tun könnte: http://stackoverflow.com/questions/1004478/ lese-pdf-files-with-php – Kaddath

+0

ty, ich habe PdfParser ausprobiert, konnte aber nicht herausfinden, wie man Lesezeichen liest. – sboesch

Antwort

0

Ok, https://github.com/smalot/pdfparser scheint in der Lage zu sein, Lesezeichen sowie Anmerkungen zu extrahieren. Zumindest bietet es ein riesiges Array mit den gewünschten Daten.

$parser = new \Smalot\PdfParser\Parser(); 
$pdf = $parser->parseFile('document.pdf'); 

print_r($pdf->getObjects()); 

Alles, was ich jetzt tun müssen, ist, herauszufinden, wie dieses Array zu verarbeiten ...

Verwandte Themen