2017-02-08 1 views
0

Ich verwende xdmp:document-filter, um Text aus Binärdokumenten zu extrahieren. Das funktioniert gut, aber ich habe ein Problem, bei dem PPTX, wenn jemand ein Excel-Diagramm einbettet, das von Excel-Blatt unterstützt wird, PPTX auch die Excel-Tabelle einbettet. Jetzt extrahiert die xdmp:document-filter die Daten aus dem eingebetteten Dokument. Gibt es eine Möglichkeit für mich, die eingebetteten Dokumente nicht zu extrahieren?xdmp: Document-Filter Extrahieren eingebetteter Excel-Arbeitsblätter

Antwort

1

Können Sie die eingebetteten Dokumente in der XML-Ausgabe identifizieren? Wenn ja, könnten Sie die eingebetteten Dokumente mit XQuery entfernen?

Verwandte Themen