Wie mache ich einen PDF-Parser in Python von Grund auf neu

-1

Ich bin auf der Suche nach einem PDF-Parser von Grund auf neu mit Python (oder) führt zu bestehenden Bibliotheken/Algorithmen zu optimieren.Wie mache ich einen PDF-Parser in Python von Grund auf neu

2016-06-12 Anuj Menta

Sagen Sie uns, was Sie bereits versucht haben und was nicht funktioniert. Bitte lesen Sie http://stackoverflow.com/help/how-to-ask –

Here Sie einige nette Tools für Ihre Notwendigkeit, wie finden:

pdfrw: Lesen und Schreiben von PDF-Dateien
Schiefer: Die aktive Entwicklung. Vereinfacht das Extrahieren von Text aus PDF-Dateien
PyPDF2: Aktive Entwicklung. Teilen, Zusammenführen, Zuschneiden usw.
PDFMiner: Aktive Entwicklung. Extrahieren von Text, Bildern, Objektkoordinaten, Metadaten aus PDF-Datei

Und es gibt mehr in diesem Link.

2016-06-12 07:16:58

Sie benötigen auch einen PDF-Inspektor, siehe http://stackoverflow.com/questions/3549541/best-tool-tool-for-inspecting-pdf -Dateien. Viel Glück! –

Antwort