Ich versuche, Text aus einer PDF zu extrahieren Python, und ich habe erfolgreich so mit PyPDF2 wie dies getan:Wie extrahiert man Text aus einem bestimmten Bereich in einem PDF mit Python?
import PyPDF2
pdfFileObj = open('path', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
pageObj = pdfReader.getPage(0)
pageObj.extractText()
Das extrahiert den gesamten Text aus der Seite, aber ich möchte nur den Text extrahieren aus einem rechteckigen Bereich von 3 'x4' im oberen linken Teil der Seite.
Ich mag im Grunde so etwas wie zu tun: How-to extract text from a pdf doc within a specific rectangular region? aber in Python
dies durch PyPDF2 oder durch eine andere Python-Bibliothek kann getan werden?