Ich benutze iTextSharp PDFReader, um eine PDF-Datei zu lesen, die 18 Seiten hat, aber jedes Mal, wenn ich die Seitenzahl inkrementiere, beginnt es am Anfang der PDF statt nur diese bestimmte Seite zu lesen . Wenn ich "x" auf den Wert von pdfReader.NumberOfPages einstelle, liest es nur die letzte Seite. Ich möchte jede Seite einzeln lesen und die Daten meiner Liste der Schnur s hinzufügen. Ich gehe auch durch einen Ordner und lese jede PDF-Datei, aber ich teste gerade mit nur einem.C# iTextSharp PDFReader liest vom Anfang der PDF Immer
List<string> s = new List<string>();
while (z < filePaths.Count())
{
PdfReader pdfReader = new PdfReader(filePaths[z]);
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
for (int x = 1; x <= pdfReader.NumberOfPages; x++)
{
string currentText = "";
currentText = PdfTextExtractor.GetTextFromPage(pdfReader, x, strategy);
s.Add(currentText);
}
z++;
pdfReader.Close();
}
ist es nur die erste Seite immer zu lesen, mit Ausnahme der letzten Seite oder liest sie alles von der ersten bis x-ten Seite jeder? die zugrunde liegende Arbeitstiermethode 'ProcessContent (int pageNumber, E renderListener)' sollte klar machen, was Sie vorhaben ... welche Version von ITextSharp verwenden Sie? –
dlatikay
mit 5.5.10.0, es beginnt immer auf der ersten Seite und liest bis zur x-ten Seite – AWooster
nur um sicher zu gehen ... erwarten Sie 's' zu enthalten alle Seiten aller Dateien, eine Seite im Wert von Text pro Listenelement, wenn die äußere Schleife fertig ist? – dlatikay