Welche Python-Pakete kann ich verwenden, um herauszufinden, auf welcher Seite sich ein bestimmter "Suchstring" befindet?Finden, auf welcher Seite ein Suchstring in einem PDF-Dokument mit Python gefunden wird
Ich schaute in mehrere Python-PDF-Pakete, aber konnte nicht herausfinden, welche ich verwenden sollte. PyPDF scheint nicht diese Funktionalität zu haben und PDFMiner scheint ein Overkill für solch eine einfache Aufgabe zu sein. Irgendwelche Ratschläge?
Präziser: Ich habe mehrere PDF-Dokumente und ich möchte Seiten extrahieren, die zwischen einer Zeichenfolge "Begin" und einer Zeichenfolge "End" sind.
Danke, das war hilfreich! –
Hallo Experten, ich weiß, es ist eine lange Zeit, aber, wie könnte ich diesen Code ändern, um PDF-Seiten mit einer bestimmten Zeichenfolge zu extrahieren und ein neues Dokument von ihnen zu erstellen? – ASPiRE