Verwenden von JavaScript Ich muss ~ 10000 Schlüsselwörter aus einem ~ 100000 Word-Dokument effizient entfernen, von denen ~ 1000 Schlüsselwörter sein werden. Welchen Ansatz würden Sie vorschlagen?effiziente Methode zum Ersetzen mehrerer Wörter im Text
Wäre ein massiver regulärer Ausdruck praktisch? Oder sollte ich nur durch die Zeichen des Dokuments iterieren, die nach Schlüsselwörtern suchen (langweilig)?
Bearbeiten:
Guter Punkt - nur ganze Wörter, keine Teile. Und einige Schlüsselwörter enthalten Leerzeichen.
Ich versuche, alle Client-Seite zu tun, um den Druck auf das Backend zu reduzieren.
Interessante Frage. Auf der einen Seite würde eine in einer kompilierten Sprache handgeschriebene Zustandsmaschine die Regex-Regeln sprengen, aber auf der anderen Seite ist Javascript selbst ziemlich langsam, also müssen Sie versuchen zu vergleichen, ob die Regex-Engine schneller ist . –
Muss es JavaScript sein oder können Sie es zur Transformation auf den Server schieben? Es ist schwer zu sagen, welches ohne einige Daten effizienter sein wird, um es zu testen. Wenn Sie beispielsweise Python verwenden, können Sie die Daten segmentieren und den Prozess fädeln, wenn dies wirklich erforderlich ist. –
Müssen Sie auch nur ganze Wörter oder Wortteile ersetzen - zB Wort, Stichwort, Wortstamm, alle haben das Wort "Wort" in sich, wie müssen sie behandelt werden? – meouw