2010-07-07 14 views
39

Ich habe gegoogelt (ohne Glück) für open source software that can convert doc, ppt, and pdf to HTML5. (Genau was Scribd tut) Gibt es Open-Source-Äquivalente zu der Art der Konvertierung Scribd tut?Convert pdf, doc, ppt zu html5

Wenn jemand einen kostenpflichtigen Dienst kennt, würde das auch funktionieren. Scribd hat eine API, aber das ist für den Flash-Viewer. Außerdem möchte ich meinen eigenen Inhalt hosten, da ich weitere Kontrolle über konvertiertes HTML Dokument benötige.

+0

Hallo! Hast du Glück dabei? –

Antwort

1

http://wvware.sourceforge.net/

wvHtml: Konvertieren Sie Ihre Word-Dokument in HTML4.0.

Möglicherweise: http://www.abisource.com/ aber in diesem Fall sieht es aus wie "open doc"> "HTML exportieren" manuell, vielleicht Plugins Hilfe. Nicht sicher, was meinst du: "Quellsoftware, die konvertieren kann".

Oder diese: http://www.zope.org/Members/sf/NuxDocument

Auch die pdftohtml wird Ihnen eine HTML-Seite output.But Sie auf der grafischen interface.Since müssen arbeiten, um es scheint nicht sehr interaktiv.

15

Sie werden wahrscheinlich kein einziges Angebot finden, das all dies bietet, besonders in der Open-Source-Welt. Es ist wahrscheinlicher, dass Sie sich letztendlich auf einen Mischmasch von Dingen verlassen und vielleicht sogar einige Konverter verketten müssen, um zu HTML zu gelangen. (ZB PDF -> ps -> HTML)

OpenOffice unterstützt die Konvertierung in HTML und kann über die Befehlszeile aufgerufen werden.

http://pdftohtml.sourceforge.net/ sieht ziemlich gut bei der Konvertierung von PDF in HTML.

Für Doc, das Word ML oder OpenXML-Format ist, ist es denkbar, dass Sie XSLT-Transformationen verwenden können, da sowohl Eingabe- als auch Ausgabeformate XML sind. Ich habe einige Stylesheets gesehen, die im Netz herumlaufen, die das tun, aber YMMV.

Übrigens, warum gibt es eine spezielle Anforderung für Open Source? MS Powerpoint unterstützt bereits zum Beispiel das Speichern als HTML.

+1

+1 für OpenOffice – vladr

+0

die alte Version von PowerPoint verwendet, um eine Reihe von Bildern für Inhalte wie PDFs in HTML zu exportieren. Dies könnte sich geändert haben, da ich es seit einiger Zeit nicht mehr ausprobiert habe. –

+0

Pdftohtml gibt einfach eine einzige HTML-Seite Ausgabe, aber Aussehen sind nicht sehr nett.als die komplexe Ausgabe gibt nette HTML-Ausgabe, aber dann erstellt es separate HTML-Dokument für jede Seite in pdf.That möglicherweise nicht möglich für die große Anzahl von PDF-Dateien. – Daenarys

5

Open Office wird PDF in HTML umwandeln, aber Sie werden einen Schlag auf Designqualität nehmen.

Ich schlage vor, entweder: Crocodoc als kostenpflichtiger Service (es verschiedene Aromen für verschiedene Plattformen wie Python bietet, Ruby, Java, PHP Entwickler dürfen auf ihre APIs arbeiten.) Oder zu einem offiziellen Adobe-Tool wartet (es ist in Arbeit).

+3

Crocodoc ist jetzt kostenlos :) – Viral

+0

danke für das update –

-1

Ich weiß, die Frage etwas älter ist jedoch habe ich neues Open-Source-Tool flaxpaper http://flexpaper.devaldi.com/

+0

ok es war open source jetzt sie für service berechnen. Dinge haben sich im Laufe der Jahre verändert –