2017-12-21 6 views
0

Was sind die Vorteile der Verwendung von ngram-Analysator mit min_gram: 3 max_gram: 10 über ngram Analysator von min_gram: 3 und max_gram: 3?Auswahl der richtigen min_gram- und max_gram ngram-Werte

Wenn min_gram gleich max_gram ist, ist die db-Größe viel kleiner als in dem Szenario, in dem sich min_gram und max_gram unterscheiden.

Wenn min_gram und max_gram sind kleiner als die Abfrage selbst, wird die Abfrage keine Stücke von max_gram Größen brocken werden, und ich werde noch in der Lage sein zu finden, „Opel“, wenn max_gram gleich 3

bin ich etwas fehlt ?

Könnte es mit Ranking zusammenhängen?

Sarching mit "Opel", wenn max_gram gleich 4 ist, wird besser Rang als Suche "Opel" geben, wenn ngram gleich 3 ist?

Welche Vorteile hat ngram (nicht Edge Ngram), wenn min_gram und max_gram unterschiedliche Werte haben?

Antwort

1

Dies könnte wahr sein, aber möglicherweise nicht. Hängt davon ab, wie viele Wörter Sie mit "ope" haben. Sie könnten Opel anstelle von Open, Oper, Oped, Operand usw. verlieren. Besonders, wenn dies kein Edge-Ngram ist, dann werden Sie auch Wörter wie Hoffnung, Seil usw. haben. Aber in relativ kleinem Maßstab (zum Beispiel in Automarken suchen das könnte akzeptable Ergebnisse liefern)

Verwandte Themen