2016-06-12 7 views
-1

Ich bin auf der Suche nach einem PDF-Parser von Grund auf neu mit Python (oder) führt zu bestehenden Bibliotheken/Algorithmen zu optimieren.Wie mache ich einen PDF-Parser in Python von Grund auf neu

+0

Sagen Sie uns, was Sie bereits versucht haben und was nicht funktioniert. Bitte lesen Sie http://stackoverflow.com/help/how-to-ask –

Antwort

1

Here Sie einige nette Tools für Ihre Notwendigkeit, wie finden:

  • pdfrw: Lesen und Schreiben von PDF-Dateien
  • Schiefer: Die aktive Entwicklung. Vereinfacht das Extrahieren von Text aus PDF-Dateien
  • PyPDF2: Aktive Entwicklung. Teilen, Zusammenführen, Zuschneiden usw.
  • PDFMiner: Aktive Entwicklung. Extrahieren von Text, Bildern, Objektkoordinaten, Metadaten aus PDF-Datei

Und es gibt mehr in diesem Link.

+0

Sie benötigen auch einen PDF-Inspektor, siehe http://stackoverflow.com/questions/3549541/best-tool-tool-for-inspecting-pdf -Dateien. Viel Glück! –

Verwandte Themen