Ich habe einen Elasticsearch-Index, der ungefähr 2,5 Milliarden Dokumente mit ungefähr 18 Millionen verschiedenen Begriffen in einem analysierten Feld enthält. Ist es möglich, schnell die Anzahl der Dokumente zu ermitteln, die einen Begriff enthalten, ohne den Index zu durchsuchen?Anzahl der Dokumente, die einen Ausdruck in elasticsearch enthalten
Es scheint, als würde ES diese Informationen speichern, während es das Feld analysiert, oder vielleicht in der Lage sein, die Länge eines invertierten Indexes zu zählen. Wenn es einen Weg gibt, nach mehreren Begriffen zu suchen und die Dokumenthäufigkeit für jeden der Begriffe zu erhalten, wäre das noch besser. Ich möchte das regelmäßig tun, und ich kann nicht sagen, ob es einen effizienten Weg dafür gibt.
Danke! Ich werde das mit meinem Kollegen besprechen. – neelshiv