Ich bin sehr neu Python und maschinelles Lernen, habe ich einige vordefinierte Kategorien oder Tag-Set wie diese [cricket, football, politics, education, movie]
usw. Jetzt möchte ich angegebenen Artikel ist, welche Kategorien ich versucht Wörter eines gegebenen Artikels zu zählen und mit dem meisten Vorkommen von Wörtern übereinstimmen zählen in bestimmten Kategorien wie Taschen von Wörtern.Artikel Klassifizierung in bestimmten Kategorien mit Python
Aber BOW (Taschen Of Word) nicht mein Problem lösen zum Beispiel dieses folgende Beispiel Artikel betrachten:
article 1: " BCCI nominate Ravi Shatri name as Indian coach " article 2: " Sachin Tendulakar is a member of Rajya Sabha "
In oberhalb dieser beiden Artikel erster Artikel eingebaut Cricket
Kategorien und zweiten Artikel eingebaut Politics
Kategorien, aber mit dem BOW passt dieser Artikel in keine der angegebenen Kategorien.
Meine Frage ist, wie man dieses Artikelklassifikationsproblem lösen kann, welcher Algorithmus dafür am besten geeignet ist. Jede Hilfe wird sehr geschätzt.
Einige Methoden, die für Sie nützlich sein könnten, wären Nearest Neighbour, SVM oder neuronale Netzwerke. Aber es hängt von der Komplexität des Problems und der Menge der Trainingsdaten ab, welche Methode Sie wählen sollten – Mathias