2016-08-24 6 views
0

So habe ich einen benutzerdefinierten Analysator, der zusätzliche Begriffe aus einer Ontologie hinzufügt. Außerdem möchte ich eine Terminierung der Begriffe vornehmen, bevor sie indexiert werden. Im Folgenden ist die index metadata aus dem Elasticsearch Kopf Plugin abgerufen.Analysieren Sie Begriffe, die in ElasticSearch indiziert werden

{ 
    "state": "open", 
    "settings": { 
     "index": { 
      "refresh_interval": "1000s", 
      "number_of_shards": "5", 
      "creation_date": "1471931611750", 
      "analysis": { 
       "filter": { 
        "owlfilter": { 
         "type": "owl", 
         "indexName": "ontoowl", 
         "expansionType": "RDFSLABEL", 
         "owlFile": "/home/tannys/elasticsearch-2.3.0/ontologyWorkTrial/myownowl.owl" 
        } 
       }, 
       "analyzer": { 
        "owlanalyzer": { 
         "filter": ["owlfilter","porter_stem"], 
         "type": "custom", 
         "tokenizer": "standard" 
        } 
       } 
      }, 
      "number_of_replicas": "1", 
      "uuid": "d8Ub8A0eSm65geMK_bpdvw", 
      "version": {"created": "2030099"} 
     } 
    }, 
    "mappings": { 
     "mytype": { 
      "properties": { 
       "nameortitle": { 
        "search_analyzer": "standard", 
        "analyzer": "owlanalyzer", 
        "store": true, 
        "type": "string" 
       }, 
       "description": { 
        "search_analyzer": "standard", 
        "analyzer": "owlanalyzer", 
        "store": true, 
        "type": "string" 
       } 
      }, 
      "aliases": [ ] 
     } 
    } 
} 

Die Ironie des Problems ist, bis ich den porter_stem Filter benutzt hatte, waren die Ergebnisse besser. Ich bin mir also nicht ganz sicher, was schief gelaufen ist. Ich möchte die Begriffe sehen, die indiziert werden. Wie kann ich sehen, wie der Analysator funktioniert, wie zum Beispiel, was Luke für Lucene tut? Jede Anleitung.

Antwort

1

Sie können die Term Vectors API here verwenden. Das würde Ihnen die Bedingungen für ein Feld in einem Dokument geben oder Sie können multi-term API auf dieselbe Weise verwenden, um Begriffe aus mehreren Dokumenten anzuzeigen.

Verwandte Themen