2009-12-10 14 views
12

Ich versuche, eine Möglichkeit zu finden, in PDF-Dateien zu suchen. Ich kam über die PHP-PDF-Klasse, aber ich finde keine Funktion zum Lesen/Suchen eines Filestreams.Suche in PDF-Dateien mit PHP

So, so naiv, wie ich bin, ich einfach versucht, einen Strom mit file_get_contents() zu erhalten, offensichtlich ist es ein verschlüsselter artiger Ausgang;)

Also meine Frage, ist es eine Möglichkeit, durch PDF-Dateien suchen ? Ich bin auf der Suche nach script-only/free/Open-Source-Lösungen und kaufe keine teuren kommerziellen libraray.

Antwort

11

XPDF?

Es gibt einen Blog-Beitrag here, der hilfreich sein kann.

Es scheint, dass einige Code here, die helfen könnte - eine einfache Klasse, die ein PDF in Klartext liest. Unsicher, ob es die Entschlüsselung unterstützt.

Es gibt auch eine Reihe von Ressourcen in der PHP-Dokumentation, die Ihnen helfen können. Click.

FPDF und FPDI kann auch helfen. Wahrscheinlich Ihre beste Wette nach etwas Recherche. **

+0

Danke, ich werde das morgen überprüfen! +1 – Ben

+0

Ich habe alle Ihre Links durchgelesen und festgestellt, dass die erwähnte Klasse Verschlüsselung nicht unterstützt. XPDF scheint also übrig zu sein, da ich an einer Windows-Maschine arbeite und xampp installiert habe, lege ich alle Dateien in das Verzeichnis x:/xampp/apache/bin/xpdf /. Aber ich kann den Befehl nicht ausführen, der in dem von Ihnen gesendeten Blogpost erwähnt wird. Irgendwelche Vorschläge, wie man XPDF richtig einrichtet? (Ich weiß nicht so viel über Webserver ... habe ich die Dateien sogar in das richtige Verzeichnis gelegt?) – Ben

11

Versuchen this article von David Walsh

+0

Danke für Ihre schnelle Antwort, ich lese und versuche es! Ich werde Sie auf dem Laufenden halten. – Ben

2

Ein PHP-Suchmaschine Sphider hat die Möglichkeit des Hinzufügens von PDF Suche über XPDF genannt. Sie können die Ergebnisvorlagen dann anpassen, damit sie mit dem Rest Ihrer Website übereinstimmen (falls zutreffend).

+0

Diese Option erfordert weiterhin die Installation anderer Bibliotheken. "Laden Sie pdftotext und catdoc herunter und installieren Sie sie dort (Pfad) in conf.php" – jay

+0

catdoc wird nur für MS-Office-Dateien benötigt, pdftotext ist Teil von XPDF, wie ich es in der FAQ "Indexierung pdf" erwähnt habe und doc-Dateien ". – akamike

+0

Danke für deine Antwort, gab dir +1 für deine Mühe, aber es ist nicht etwas, das ich suche. Vielen Dank. – Ben