Ich entwickle gerade ein Programm mit der Fähigkeit, einen kleinen Text (etwa 250 Zeichen) mit einer Sammlung ähnlicher Texte (etwa 1000-2000 Texte) zu vergleichen.NLP/Machine Learning Textvergleich
Der Zweck ist zu prüfen, ob Text A einem oder mehreren Texten in der Sammlung ähnlich ist und wenn ja, muss der Text in der Sammlung nach ID abrufbar sein. Jeder Text erhält eine eindeutige ID.
Es gibt zwei Möglichkeiten, wie ich die Ausgabe sein möchte:
Option 1: Text Ein angepaßter Text B mit 90% Ähnlichkeit, Text C mit 70% Ähnlichkeit, und so weiter.
Option 2: Text Angepasstes Text D mit der höchsten Ähnlichkeit
ich etwas Maschinelles Lernen in der Schule gelesen haben, aber ich bin mir nicht sicher, welcher Algorithmus passt dieses Problem die beste oder wenn ich in Betracht ziehen sollten NLP mit (nicht vertraut mit dem Thema).
Hat jemand einen Vorschlag, welchen Algorithmus zu verwenden oder wo finde ich die notwendige Literatur, um mein Problem zu lösen?
Danke für jeden Beitrag!
Ich bin ziemlich neu in ML und hoffte, Cloud-ML-Dienste Google, Azire, Watson zu verwenden. Ich muss auch Textvergleiche lösen, was hast du implementiert? – jasan