2017-05-03 4 views
-1

Wie bekomme ich die TextRenderInfo von der pdf-Seite mit dem iText 7. Ich muss herausfinden, ob ein Text existiert und die y-Koordinate dieser pdf-Seite ableiten. Irgendwelche Vorschläge bitte?Wie bekomme ich die TextRenderInfo von pdfpage in iText7

Alle Optionen, mit ..

ITextExtractionStrategy textStrategy = new SimpleTextExtractionStrategy(); 
ITextExtractionStrategy locationStrategy = new LocationTextExtractionStrategy(); 
+0

* "So erhalten Sie die TextRenderInfo von der PDF-Seite mit dem iText 7" * - Welche 'TextRenderInfo' genau? Normalerweise führt das Parsen von Seiteninhalten zu sehr vielen Instanzen dieser Klasse ... – mkl

Antwort

1

Einfach, implementieren ITextExtractionStrategy (oder einer bestehenden Implementierung erweitern). Die Schnittstelle hat folgende Methode

@Override 
public void eventOccurred(IEventData data, EventType type) { 

    // you can first check the type of the event 
    if (!type.equals(EventType.RENDER_TEXT)) 
     return; 

    // now it is safe to cast 
    TextRenderInfo renderInfo = (TextRenderInfo) data; 
} 

Sobald Sie eine solche Implementierung haben, müssen Sie

MyCustomStrategy strategy = new MyCustomStrategy(); // this is the class I described earlier 
PdfTextExtractor.getTextFromPage(doc.getPage(pageNr), strategy); 

Ihre Gewohnheit zu können ITextExtractionStrategy dann einfach programmiert werden, um alle TextRenderInfo Objekte zu speichern. Und bieten einen einfachen Getter.

Verwandte Themen