Mit einem Klassifizierungsalgorythm (zum Beispiel naive bayes oder SVM) und StringToWordVector, wäre es möglich, TF/IDF zu verwenden und Terme Häufigkeit in der gesamten aktuellen Klasse statt nur zu zählen in einem einzigen Dokument suchen?Kann TF/IDF Klassen im Konto verwenden
Lassen Sie mich erklären, ich möchte, dass die Berechnung den Wörtern, die sehr häufig für eine gegebene Klasse (nicht nur für ein gegebenes Dokument) sind, hohe Punktzahl gibt, aber nicht sehr häufig im ganzen Korpus.
Ist es möglich, aus der Box oder benötigt dies einige zusätzliche Entwicklungen?
Thanks :)