Ich bekomme keine Lösung dafür haben wir Option zum Extrahieren ganzen Textes mit Pypdf
, aber ich möchte den Text Zeile für Zeile extrahieren. Jede Hilfe wäre willkommen. DankWie extrahiere ich Zeile für Zeile aus Pdf in Python?
-1
A
Antwort
0
Wenn Sie Ubuntu verwenden, könnten Sie so etwas wie:
$ less <file_name>.pdf >op.txt
und zuerst den Text in der pdf in eine Textdatei umleiten und dann durch eine Linie mit der Python-Code-Leseleitung:
f=open("op.txt",'r')
for line in f:
line=line.strip('\n')
print(line)
f.close()
+0
Während weniger automatisch einige Konverter (wie zB pdftotext von [Poppler] (https://poppler.freedesktop.org/)) aufrufen kann, ist es kein Konverter selbst. Dies ist sehr wahrscheinlich, nur das PDF zu kopieren. –
Verwandte Themen
- 1. Python pdf Zeile für Zeile
- 2. Wie extrahiere ich eine Zeile einer Datei in Python?
- 3. Wie extrahiere ich Text aus einer PDF-Datei in Python?
- 4. Wie dekodiere ich Unicode Zeile für Zeile in Python 2.7?
- 5. PDF Zeile für Zeile lesen - iTextSharp
- 6. pandas.DataFrame: Wie Zeile für Zeile div [Python]
- 7. Python Zeile für Zeile Ausführung
- 8. Python Schreiben in CSV Zeile für Zeile
- 9. Übereinstimmendes Schlüsselwort und extrahiere Zeile
- 10. Wie extrahiere ich einen Teil einer Zeile in Ruby?
- 11. Wie extrahiere ich Vektorgrafiken aus einem PDF-Dokument?
- 12. Vergleichen von Werten aus verschiedenen Datenrahmen Zeile für Zeile, Python
- 13. Zeile für Zeile Textnachrichten - Python & Twilio
- 14. Wie lösche Zeile aus Textdatei in Python?
- 15. Python: Schreiben Array Zeile für Zeile
- 16. Wie Wörterbuch Werte Zeile für Zeile in Python drucken?
- 17. Python-Datei lesen, Zeile für Zeile schreiben
- 18. Wie Zeile für Zeile aus einer Datei in Haskell
- 19. Extrahiere die erste Zeile aus jeder Textdatei im Verzeichnis Teilbaum
- 20. Extrahiere xdp oder xfa aus PDF
- 21. Python Code Zeile für Zeile Bedeutung
- 22. Python nicht Zeile für Zeile schreiben
- 23. Wie extrahiere ich die Zeile, die nur die Dauer enthält?
- 24. Wie extrahiere ich die Zeile mit Min- oder Max-Werten?
- 25. Wie schreibe ich eine Datei Zeile für Zeile in R
- 26. Lesen aus Datei Zeile für Zeile
- 27. Python Zeile für Zeile in eine Textdatei schreiben
- 28. Wie extrahiere ich bestimmte Zeileninformationen aus der Textdatei min, max, median und lösche eine ausgewählte Zeile?
- 29. Wie extrahiere ich eine Zahl (float) aus einer bestimmten Zeile einer Datei in C++?
- 30. Wie Zahlen Zeile für Zeile
StackOverflow erwartet, dass Sie [versuchen, Ihr eigenes Problem zuerst zu lösen] (http://meta.stackoverflow.com/questions/261592), und wir [beantworten auch keine Hausaufgabenfragen] (https: // softwareengineering.meta.stackexchange.com/questions/6166). Bitte aktualisieren Sie Ihre Frage, um zu zeigen, was Sie bereits in einem [minimalen, vollständigen und überprüfbaren Beispiel] (http://stackoverflow.com/help/mcve) versucht haben. Weitere Informationen finden Sie unter [Fragen stellen] (http://stackoverflow.com/help/how-to-ask) und nehmen Sie die [Tour der Website] (http://stackoverflow.com/tour)) :) – Barmar
Ich versuche das, aber es gibt den ganzen Text. Ich möchte Zeile für Zeile Text extrahieren. import PyPDF2 pdfFileObj = open (R'C: \ Benutzer \ Desktop \ new.pdf‘, 'rb') PdfReader = PyPDF2.PdfFileReader (pdfFileObj) pageObj = pdfReader.getPage (0) text = Str (pageObj .extractText()) –
Setzen Sie Ihren Code in die Frage, damit es richtig formatiert und lesbar ist. – Barmar