2012-04-04 6 views
1

Wir müssen in eine bestehende Java-Web-Anwendung integrieren, eine neue Funktion, die es dem Benutzer ermöglicht, 2 PDF-Dokumente zu vergleichen und die Unterschiede zu sehen. Also begann ich nach einer bereits bestehenden Bibliothek oder einem Tool zu suchen (Open Source oder kommerziell), das mir helfen könnte, diese Anfrage zu lösen. Weiß jemand, ob existiert diese Art von Anwendung? Das würde 2 pdf dauern, vergleichen Sie sie und zeigen Sie die Unterschiede an?Web-basierte Anwendung für die Vergleich von 2 PDF-Dokumenten

Vielen Dank im Voraus, Madalina

+0

Solche Tools existieren - die Frage ist, was genau Sie unter Unterschiede meinen. Möchten Sie wissen, ob der Text anders ist? Wenn die Formatierung des Textes anders ist? Wenn ein Element (Text oder Bild) an einem anderen Ort ist? Wenn ein Pixel in einem Bild anders ist? Für jeden Fall gibt es unterschiedliche Ansätze. –

Antwort

0

Meine Antwort kann nicht zufriedenstellend sein, aber dieses Projekt von Apache -> http://pdfbox.apache.org/

kann helfen, u. Sie können die PDFs in eine Textdatei konvertieren und vergleichen.

0

Hallo Ich habe ein PDF-Vergleich Projekt auf PDFBox gebaut Sie können Quellcode donwload von link

Beispiel Verwendung wird erwähnt, darunter drei Ebenen des Vergleichs führt können Sie einfach eine Schleife hinzufügen, indem Ziel- und Quellname Speichern von Dateien in eine Liste und dann Aufruf seiner Vergleichsfunktionalitäten.

 pdfComparison cmp=new pdfComparison(); 
     //Text Comparision page by page   if(cmp.textComparision("ReferencePDF\\PDF2_302.pdf","C:\\\PDF2_305.pdf")) 
       { 
     System.out.print("\n********PDF text is identical******* "); 

       } 
       else 
       { 
        System.out.print("\n********PDF text is not identical******* "); 

       } 

//Extract all images in PDF and compare 
    cmp.extract_ALL_Images_ThenCompare("PDF2_302.pdf","PDF2_302.pdf"); 

//Convert Both PDF pages into JPG and perform image comparison 
     cmp.PDF_Convert_To_Jpeg_Comparision("PDF2_302.pdf","PDF2_302.pdf"); 

Sie werden alle Bildunterschiede im Ordner Unterschiede im Projekt sehen. Wenn irgendein Problem nur eine Nachricht für mich

+1

Ihr Projekt verwendet die aktuelle PDFBox-Version 1.8.9. Es ist bekannt, dass PDFBox-Versionen vor Version 2 viele Defizite beim Rendern von PDF-Seiten als Bilder haben, die im aktuellen 2.0.0-SNAPSHOT behoben wurden. PDF-Vergleiche auf der PDFBox 1.8.9 könnten also als erster Rauchtest oder in sehr kontrollierten Umgebungen mit PDFs funktionieren, die PDFBox 1.8.9 richtig darstellen kann, nicht jedoch im Produktionscode für generische PDFs. – mkl

+0

Ich mache keinen Vergleich mit PDF-Box Ich extrahiere nur Inhalte per PDF-Box. Bitte Code zuerst herunterladen und überprüfen Sie es selbst. – fahad

+0

Es funktioniert gut in meinem Rahmen Arbeit Infact Ich verglichen 300 Seiten PDF – fahad

Verwandte Themen