Ich habe eine große Sammlung von MSWord-Dokumenten (ca. 40.000), die die Ergebnisse von Mailmerges (dasselbe Hauptdokument, andere Datenquellen) sind.MergeField-Werte aus Mail-fusion Word-Dokument programmgesteuert abrufen
Eines der Serienfelder ist ein Textfeld, das den Text "Ja" oder "Nein" haben könnte.
Gibt es einen einfachen Weg, um aufzulisten, welches der Dokumente, die das Zusammenführungsfeld haben, auf den Wert "Ja" gesetzt wurde? (Ich erwarte etwa 10.000 "Ja" Dokumente.)
Ich würde in jedem Ansatz interessiert sein, ob mit Word selbst, Office-Automatisierung, Hexdumping der Binärdateien und grepping für bestimmte Magie, oder irgendwelche vorgefertigten Tools (Perl-Skripte, .NET-Anwendungen, etc.), die solche Dinge tun können.
Die Dateien befinden sich auf einer Netzwerkfreigabe, die sowohl von Linux- als auch von Windows-Boxen zugänglich ist (und ich kann wahrscheinlich einen Mac für eine Weile stehlen), also mache ich mir keine Sorgen, auf welcher Plattform die Tools laufen.
Ja, das ist meine Einschätzung der Situation am Moment. Ich erwog, wvWare als Option für den binären Prozessor oder die VBA-Route zu verwenden. Ich hatte gehofft, jemand hätte entweder a) Vorschläge von bereits vorhandenen Tools/VBA-Skripten, oder b) einige Dokumente, wo man im Binärformat nachschauen kann. – Stobor