Ich versuche Scikit für Natural Language Processing zu verwenden und ich beginne mit dem Lesen einiger Tutorials. Ich habe dieses http://www.markhneedham.com/blog/2015/02/15/pythonscikit-learn-calculating-tfidf-on-how-i-met-your-mother-transcripts/ gefunden, das erklärt, wie man tfidf Ergebnisse von einer Reihe von Dokumenten erhält.Wie finde ich TF-IDF eines Begriffes in Bezug auf ein Dokument mit scikit
Aber ich habe eine Frage, TF-IDF soll von einem Begriff, dem Dokument dieses Begriffes und der Sammlung aller zu analysierenden Dokumente abhängen.
Also zum Beispiel. In einer Sammlung von zwei Dokumenten, A und B, sollte der Ausdruck "Pferd" einen anderen TF-IDF-Wert bekommen, wenn wir TF-IDF unter Verwendung von Dokument A als denselben Ausdruck berechnen, aber durch Analyse der Termhäufigkeit aus Dokument B.
Wie kann ich TF-IDF eines Begriffs in Bezug auf ein bestimmtes Dokument mit scikit berechnen?