2017-08-24 2 views
0

Ich habe eine Solr 6.6.0 Instanz ausgeführt und habe einige Dokumente indiziert - PDF und HTML. Zuvor hatte ich Solr 4 und die Suche mit Hervorhebung Ergebnisse war in Ordnung. Leider scheint dieses (Standard) Verhalten in v6 verschwunden zu sein. Das Setup ist das Standard-Tutorial, das im ursprünglichen solr-Tutorial erwähnt wird. Ich habe mit vielen GET-Parametern herumgespielt, kann aber Inhalte nicht hervorheben. Ich freue mich über jeden Hinweis oder Tipp, um dies zu starten. Fehle ich einige Konfigurationsänderungen oder Parameter?Solr 6 Hervorhebung zeigt keinen Inhalt oder _text_

z.

http://serv1:8983/solr/gettingstarted/select?wt=json&indent=true&q=betreten&hl=true&hl.method=unified 

gibt

{ 
    "responseHeader":{ 
    "zkConnected":true, 
    "status":0, 
    "QTime":152, 
    "params":{ 
     "q":"betreten", 
     "hl":"true", 
     "indent":"true", 
     "hl.method":"unified", 
     "wt":"json"}}, 
    "response":{"numFound":1,"start":0,"maxScore":0.822483,"docs":[ 
     { 
     "id":"/var/docs/2017/08/22/2319/page-1.html", 
     "stream_size":[3820], 
     "x_parsed_by":["org.apache.tika.parser.DefaultParser", 
      "org.apache.tika.parser.html.HtmlParser"], 
     "stream_content_type":["text/html"], 
     "dc_title":["/var/docs/2017/08/22/2319/page-1.html (22.08.2017 23:19)"], 
     "ocr_system":["tesseract 3.04.01"], 
     "content_encoding":["UTF-8"], 
     "content_type_hint":["text/html; charset=utf-8"], 
     "resourcename":["/var/docs/2017/08/22/2319/page-1.html"], 
     "title":["/var/docs/2017/08/22/2319/page-1.html (22.08.2017 23:19)"], 
     "content_type":["application/xhtml+xml; charset=UTF-8"], 
     "ocr_capabilities":["ocr_page ocr_carea ocr_par ocr_line ocrx_word"], 
     "_version_":1576604407523442688}] 
    }, 
    "highlighting":{ 
    "/var/docs/2017/08/22/2319/page-1.html":{ 
     "_text_":[]}}} 

Thank you!

Antwort

1

Textmarker im Allgemeinen analysieren gespeichertText im laufenden Betrieb, um zu markieren. In Ihrem Schema überprüfen Sie bitte, ob _text_ gespeichert ist oder nicht. Wenn das Schema verwaltet wird, wird _text_ möglicherweise nicht gespeichert. Bitte überprüfen Sie folgende _text_ config in Managed-Schema oder schema.xml

<field name="_text_" type="text_general" multiValued="true" indexed="true" stored="false"/> 

stored=false zeigt an, dass Inhalte von _text_ werden nicht gespeichert. Wenn Sie stored="true" einstellen, wird _text_ gespeichert und steht für die Hervorhebung zur Verfügung.

Hinweis: Nach dem Wechsel schema.xml oder verwalteten-Schema-Dateien,

  • Sie benötigen Solr Instanz retstart, so dass Änderungen wirksam werden
  • Daten
+0

ich neu geladen werden müssen Hat dies in allen managed_schema-Dateien gefunden, aber das gleiche Ergebnis. Das Problem natürlich sitzt vor der Maschine, aber ich kann nicht herausfinden, wie man mich repariert – Aviator

+0

@Aviator, haben Sie Solr Neustart und Reindexing nach dem Ändern der verwalteten Schema-Datei? (Ich habe die Antwort bearbeitet, bitte überprüfen Sie) – Shubhangi

+0

Sorry Shubhang, keine Freude nach dem Neustart. Ich habe den Wert in example/files/conf/managed-schema, server/solr/configsets/data_driven_schema_configs/conf/managed-schema und server/solr/configsets/basic_configs/conf/managed-schema geändert, neu gestartet und neu indiziert. – Aviator