2008-09-16 19 views
0

Ich versuche eine Web-App zu schreiben, um Referenzen für meine Doktorarbeit zu verwalten.Extrahieren von Text aus einem PDF mit JBoss Richfaces

Ich habe diese Informationen in einer persönlichen Confluence (fantastisches Tool! - http://www.atlassian.com/software/confluence/) Instanz verwaltet, aber ich bin satt mit dem Öffnen von PDFs und Ausschneiden und Einfügen von Werten in Felder, die ich aufnehmen möchte.

Ich habe einen Webservice veröffentlicht, der mir Bilder basierend auf einem PDF-Dateinamen und einer Seitennummer zurückgibt. Derselbe Webservice stellt auch eine Methode bereit, die den Text innerhalb eines bereitgestellten Rechtecks ​​zurückgibt (oben links x-y-Koordinate, unten rechts x-y-Koordinate).

Ich möchte in der Lage sein, ein Rechteck über einen Teil des PDF-Bildes ziehen und dann den Webservice anrufen, um mir den Text (die ich dann auf einer EntityBean speichern). Ich untersuche den JBoss Application Stack (Application Server, Hibernate, Seam und Richfaces). Weiß jemand, wie ich das erreichen könnte? Ich habe die Fähigkeit gesehen, benutzerdefinierte Bilder in anderen RIA-Toolkits (z. B. Dojo) zu zeichnen, aber ich sehe keine Möglichkeit, dies in Richfaces zu tun.

Hoffentlich könnte jemand da draußen mich verraten oder eine Idee darüber geben, was ich tun kann (da ich kein Webentwickler bin - ich baue hauptsächlich dieses Tool, weil die jetzt verfügbaren RIA-Frameworks mich interessiert haben!)

Ich habe bereits den Code, um den Text zu extrahieren, mein Problem ist rein wie kann ich den Benutzer dazu bringen, ein "Auswahlrechteck" innerhalb des Webbrowsers über den oberen Rand des Bildes zu zeichnen?

Vielen Dank,

Aidos

Antwort

1

Versuchen Sie es mit dem RichFaces Paint 2D Tag

Es macht die Graphics2D Paket an der Benutzeroberfläche.

Verfolgen Sie Benutzer Drag-Ereignisse auf dem Bild mithilfe von JavaScript, dann buchen Sie die Coordindinates auf die Backing-Bean, um das Bild mit einem gezeichneten Auswahlfeld neu zu rendern.

0

Haben Sie in Betracht gezogen Mendeley? Es wird versuchen, bibliographische Informationen aus Ihren PDFs zu analysieren und zu extrahieren.