Ich versuche eine Suchmaschine zu erstellen, die Online-Kleinanzeigen wie Oodle, eBay-Motoren und Craigslist durchläuft. Ich habe auch eine große Datenbank von Standard-Fahrzeugnamen und Spezifikationen über sie. Was ich tun möchte, ist für jeden Datensatz, den ich über die klassifizierte Website finde, in der Lage sein, genau zu bestimmen, welches Fahrzeugmodell, Stil es ist (aus meiner Datenbank). Zum Beispiel ist ein Standardname für einen Ford LKW in meinem DB: 2003 Ford F150.Was ist die beste Data-Mining-Methode für die Fahrzeugsuche?
Aber auf klassifizierten Websites, die Menschen beziehen können, ist wie: "2003 Ford F 150" oder "2003 Ford F-150" oder "03 Ford Truck 150". Gibt es einen effektiven Data-Mining/Text-Klassifizierungsalgorithmus, um diese Texte auf den obigen Standardnamen normalisieren zu können?