Ich bin auf der Suche nach einem Dienstprogramm oder Bibliothek zum Extrahieren von Text aus PDFs und Formatieren im Klartext unter Beibehaltung so viel des ursprünglichen Layouts wie möglich (z. B. Tabellen, Spalten usw.).PDF in formatiertes ASCII konvertieren - was ist der Stand der Technik?
Wir verwenden derzeit pdftotext, aber ich frage mich, ob es etwas besseres gibt. Es muss sich um ein Befehlszeilentool oder eine Bibliothek handeln, die wir in unsere App einbinden können.
Ist pdftotext so gut wie es geht, oder gibt es etwas besseres?
Es gibt viele pdf-Bibliothek ... Einfach googeln. –