2016-12-30 5 views

Antwort

1

PDFsharp wurde nicht für diese Aufgabe entwickelt. Sie benötigen Code von Drittanbietern/eigenen Code, der Text zusammen mit den Koordinaten extrahiert.

Vielleicht können Sie PdfTextract verwenden, um loszulegen:
https://www.nuget.org/packages/PdfTextract/

+0

Bitte beachten Sie, 'PdfTextract' ist wirklich * sehr * einfach und funktioniert nur für sehr einfache PDFs. Es kann als Ausgangspunkt dienen, erfordert aber viel Verbesserung. – mkl

+0

Ich habe begonnen, PDFBox für den gleichen Zweck zu verwenden. Ist es eine gute Bibliothek zum Parsen von PDFs? Bitte beachten Sie, dass ich seinen .net-Wrapper verwende. Ich kann ItextSharp nicht verwenden, da der Benutzer eine Lizenz erwerben muss. –

0

Ich benutzte die PDFBox Bibliothek für die purpose.It wirklich cumbersome.But es die Arbeit erledigt hast.

+2

Während dies Ihre Lösung Ihres Problems sein kann, ist es keine Antwort auf die Frage "Wie man Text basierend auf Koordinaten mit PDFsharp extrahieren?" – mkl

+0

Punkt ist vermerkt. –

Verwandte Themen