Ich verwende Abfragen (Solr Admin), um Wörter durch zwei Textdokumente zu durchsuchen, die sich in meinem HDFS befinden. Wie kann ich den Namen des Dokuments abrufen, die das Wort gefunden wird. Ich dieses Projekt https://github.com/lucidworks/hadoop-solrSolr-Abrufen des Namens des Dokuments, in dem das Wort gefunden wird
ich eine Sammlung erschaffe bin/solr -e cloud
mit verwende und ich bin mit „data_driven_schema_configs“ von Server/Solr/configsets/ Verzeichnis.
tryied I <field name="fileName" type="string" indexed="true" stored="true" />
innerhalb Managed-Schema Hinzufügen bei ~/Solr-6.1.0/server/Solr/configsets/data_driven_schema_configs/conf, und es auch zu schema.xml Namen ändern, aber in diesem Verzeichnis gibt es keine Datei DataConfig hinzufügen <field column="file" name="fileName"/>
wie ich sehe es in einigen anderen Posts mit ähnlichen Fragen, aber nicht für SolrCloud, so weiß ich nicht, ob das ich versuche, ist richtig. Was sich ändert und in welchen Verzeichnissen ich tun muss, um es möglich zu machen.
Beispiel: Ich suche das Wort "größter", das in beiden Dokumenten gefunden werden kann. Wie kann ich sehen, in dem Dokument jedes Ergebnis ist, sample1.txt oder Sample2.txt
Wenn dies die einzigen Felder in Ihrem Index sind, der die Dokumente beschreibt, können Sie nicht. Wie haben Sie die Indexdateien erstellt? Diese 'ID'-Werte scheinen der eigentliche Text aus den Dokumenten zu sein, und nicht geeignete eindeutige IDs. – MatsLindh
Ich verwende dieses Projekt https://github.com/LucidWorks/hadoop-solr @MatsLindh –
Sie sollten Solr Grundlagen lesen, bevor Sie fragen. Wie @MatsLindh sagte, ist das erste, dass Sie geeignete eindeutige IDs für das Feld "ID" bereitstellen sollten. Der tatsächliche Text aus den Dokumenten sollte in einem entsprechenden Textfeld indiziert werden, siehe [Solr-Feldtypen] (https://cwiki.apache.org/confluence/display/solr/Solr+Field+Types). Wenn Sie den Namen der übereinstimmenden Dokumente angeben möchten, warum indexieren und speichern Sie nicht den Namen der Dokumente? – EricLavault