2012-04-15 10 views
1

Ich habe eine PDF-Datei mit beiden Text und Bilder Inhalt. Ich muss es analysieren. Gibt es Rubin Juwel kann nützlich sein? Ich habe pdf-reader Ruby Gem versucht, aber nicht Bilder analysierte :(Ruby Parse PDF-Datei mit Text und Bildern

Eine alternative Lösung, um die pdf zu extrahieren ist in HTML und dann die HTML-Inhalte zu analysieren. Gibt es einen Open-Source-PDF2HTML Wandler mit sowohl Text arbeiten kann und Bilder?

+0

Was meinst du mit 'parse'? Möchten Sie Daten extrahieren? eine Seite rendern? –

+0

Ich möchte Daten extrahieren –

Antwort

Verwandte Themen