Wie extrahiert man Text basierend auf Koordinaten mit PDFsharp?

Ich möchte mit PDFsharp Text in der unteren rechten Ecke der PDF extrahieren. Die einzige Möglichkeit ist die Angabe von Koordinaten.Wie extrahiert man Text basierend auf Koordinaten mit PDFsharp?

Also, wie kann ich Text aus PDF extrahieren, indem Sie Koordinaten mit PDFsharp Bibliothek angeben?

Quelle

2016-12-30 V K

PDFsharp wurde nicht für diese Aufgabe entwickelt. Sie benötigen Code von Drittanbietern/eigenen Code, der Text zusammen mit den Koordinaten extrahiert.

Vielleicht können Sie PdfTextract verwenden, um loszulegen:
https://www.nuget.org/packages/PdfTextract/

Quelle

2016-12-30 11:13:07

Bitte beachten Sie, 'PdfTextract' ist wirklich * sehr * einfach und funktioniert nur für sehr einfache PDFs. Es kann als Ausgangspunkt dienen, erfordert aber viel Verbesserung. – mkl

Ich habe begonnen, PDFBox für den gleichen Zweck zu verwenden. Ist es eine gute Bibliothek zum Parsen von PDFs? Bitte beachten Sie, dass ich seinen .net-Wrapper verwende. Ich kann ItextSharp nicht verwenden, da der Benutzer eine Lizenz erwerben muss. –

Ich benutzte die PDFBox Bibliothek für die purpose.It wirklich cumbersome.But es die Arbeit erledigt hast.

Quelle

2017-02-09 06:54:46

Während dies Ihre Lösung Ihres Problems sein kann, ist es keine Antwort auf die Frage "Wie man Text basierend auf Koordinaten mit PDFsharp extrahieren?" – mkl

Punkt ist vermerkt. –

Wie extrahiert man Text basierend auf Koordinaten mit PDFsharp?

Antwort

Verwandte Themen