machen arbeite ich versuche, automatisch kurze Artikel zu kategorisieren, und ich versuche, herauszufinden, wie ähnliche Worte passen - zB Regal Regale oder Malerei und neu streichenwie könnte ich ein Suchspiel nach ähnlichen Worten
I benutze den Porter Stemming Algorithmus, aber es hilft nur in bestimmten Situationen und nur mit dem Ende des Wortes (beide Beispiele oben funktionieren nicht damit).
Gibt es ein Algorithmus oder ein verwandtes Wortlisten, die mit so etwas wie diese (meine eigene außerhalb zu machen?) Helfen würde
(in PHP so in dieser Sprache arbeite ich irgendwelche Lösungen wäre hilfreicher sein.)
Ein besonderes Problem mit Levenshtein in dieser Art von Kontext ist, dass Sie eine gute Schwelle finden müssen; Es gibt nur die Anzahl der Änderungen zwischen den beiden Wörtern zurück. Es gibt einen großen Unterschied zwischen den beiden Beispielen im ursprünglichen Beitrag: Levenshtein ("Regal", "Regale") = 3, Levenshtein ("Malerei", "Repaint") = 5. –
als Referenz - Ich fand http : //stackoverflow.com/questions/634995/implementation-of-levenshtein-distance-for-mysql-fuzzy-search, die eine Verknüpfung zu einer mysql Stored Procedure-Version enthält. Wie Jan schon sagte, ist noch nicht klar, wie nah es kommen wird. Aber es ist einen Versuch wert. – Yehosef
Dies ist die nächste Antwort - es ist nicht ideal, aber ein guter Anfang. Die Wortliste von Jan ist idealer, aber an dieser Stelle nicht so praktisch. – Yehosef