Ich richte eine Solr-Suchmaschine ein, die mehrere Sprachen indizieren wird. Ich habe eine benutzerdefinierte UpdateProcessorFactory erstellt, um herauszufinden, welche Abschnitte des Eingabetextes welche Sprache sind. Anschließend kopiere ich diese Abschnitte des Dokuments in sprachspezifische Felder. Zum Beispiel mit diesem Text:Mehrsprachiger Solr-Suchindex
"Hallo Welt, Bonjour le Monde, Hallo Welt."
Es kopiert "Hello World" in das En-Textfeld, "Bonjour le Monde" in das Fr-Textfeld und "Hallo Welt" in das De-Textfeld. Jedes Feld verfügt über die entsprechenden Sprachanalysatoren, um die Wörter zu tokenisieren und zu verankern.
Am Ende möchte ich eine Box für einen Benutzer haben, um Suchbegriffe eingeben, die in allen Sprachen suchen würde. Die Suchbegriffe müssen nicht übersetzt werden, aber sie sollten angemessen behandelt werden. Was ist der beste Weg, dies zu erreichen? Ich bin auch sehr besorgt über die Leistung der Suchanfragen.