2016-10-10 9 views
0

Ich möchte in der Lage sein, ein (möglicherweise komplexes) LaTeX-Dokument zu nehmen und die LaTeX-Quelle herauszuziehen, die in mathmode gerendert würde. Optionen, die ich denken kann, sind,Wie man Mathe aus Latex-Dokumenten extrahiert

  • Grep für equation, $$, etc
  • Verwenden Sie das extract Paket für LaTeX
  • Verwenden Sie einen Konverter wie pandoc und extrahieren Sie die Ausdrücke aus einem einfacheren Format
  • Verwenden Sie die intermediate DOM von einem Renderer (plasTeX scheint dazu geeignet zu sein)

Leider grep ing ist hacky und funktioniert nicht mit Makros; extract scheint zu funktionieren, ist aber umständlich zu bedienen; Sowohl pandoc als auch plasTeX haben Probleme mit komplizierten "echten" Dokumenten.

Habe ich keine einfachere/robustere Möglichkeit, dies zu tun?

Antwort

1

Während Pandoc keine komplizierteren Layouts darstellen kann, unterstützt es Mathe und der pandoc LaTeX Reader erkennt mathematische Umgebungen sehr zuverlässig. Also würde ich empfehlen, eine pandoc filter zu schreiben, die alles außer Math elements fallen lässt. Sie können auch Filter in Python schreiben, aber in Haskell etwas entlang der Linien von:

#!/usr/bin/env runhaskell 
-- dropNonMath.hs 
import Text.Pandoc.JSON 

main = toJSONFilter dropNonMath 
    where dropNonMath (Math x y) = Math x y 
     dropNonMath _ = [] 

führen Sie es dann mit:

pandoc --filter dropNonMath.hs -f latex -t latex input.tex 
Verwandte Themen