So habe ich einen benutzerdefinierten Analysator, der zusätzliche Begriffe aus einer Ontologie hinzufügt. Außerdem möchte ich eine Terminierung der Begriffe vornehmen, bevor sie indexiert werden. Im Folgenden ist die index metadata
aus dem Elasticsearch Kopf Plugin abgerufen.Analysieren Sie Begriffe, die in ElasticSearch indiziert werden
{
"state": "open",
"settings": {
"index": {
"refresh_interval": "1000s",
"number_of_shards": "5",
"creation_date": "1471931611750",
"analysis": {
"filter": {
"owlfilter": {
"type": "owl",
"indexName": "ontoowl",
"expansionType": "RDFSLABEL",
"owlFile": "/home/tannys/elasticsearch-2.3.0/ontologyWorkTrial/myownowl.owl"
}
},
"analyzer": {
"owlanalyzer": {
"filter": ["owlfilter","porter_stem"],
"type": "custom",
"tokenizer": "standard"
}
}
},
"number_of_replicas": "1",
"uuid": "d8Ub8A0eSm65geMK_bpdvw",
"version": {"created": "2030099"}
}
},
"mappings": {
"mytype": {
"properties": {
"nameortitle": {
"search_analyzer": "standard",
"analyzer": "owlanalyzer",
"store": true,
"type": "string"
},
"description": {
"search_analyzer": "standard",
"analyzer": "owlanalyzer",
"store": true,
"type": "string"
}
},
"aliases": [ ]
}
}
}
Die Ironie des Problems ist, bis ich den porter_stem
Filter benutzt hatte, waren die Ergebnisse besser. Ich bin mir also nicht ganz sicher, was schief gelaufen ist. Ich möchte die Begriffe sehen, die indiziert werden. Wie kann ich sehen, wie der Analysator funktioniert, wie zum Beispiel, was Luke für Lucene tut? Jede Anleitung.