0
Ich habe eine PDF-Datei und möchte daraus Text extrahieren. Ich benutze PDFTextStream. Ich habe diesen Code aus seiner Dokumentation, aber es gibt einen Fehler.Java - Fehler bei der Verwendung von PDFTextStream
import com.snowtide.PDF;
import com.snowtide.pdf.Document;
import com.snowtide.pdf.OutputTarget;
public class ExtractText {
public static void main (String[] args) throws java.io.IOException {
// String pdfFilePath = args[0];
Document pdf = PDF.open("data/bill.pdf");
StringBuilder text = new StringBuilder(1024);
pdf.pipe(new OutputTarget(text));
pdf.close();
System.out.println(text);
}
}
Dies ist der Fehler:
Exception in thread "main" java.lang.NullPointerException
at com.snowtide.pdf.e.b(SourceFile:2740)
at com.snowtide.pdf.e.a(SourceFile:2691)
at com.snowtide.pdf.e.c(SourceFile:2642)
at com.snowtide.pdf.e.a(SourceFile:2059)
at com.snowtide.pdf.e.c(SourceFile:2108)
at com.snowtide.pdf.e.a(SourceFile:1950)
at com.snowtide.pdf.e.a(SourceFile:1755)
at com.snowtide.pdf.e.a(SourceFile:1820)
at com.snowtide.pdf.e.pipe(SourceFile:468)
at ExtractText.main(ExtractText.java:12)
Ich verwende PDFTextStream Version 3.3.1. Linie 12 ist dies:
pdf.pipe(new OutputTarget(text));
'pdf' ist null. Wahrscheinlich ist der an "PDF.open()" übergebene Pfad falsch. – dambros
Bitte posten Sie einige andere Zeilen des Fehlers, mindestens die nächsten 5 Zeilen – Dazak
@Dazak Das ist alles, keine anderen Fehlerzeilen. – Dax