Hallo Ich habe folgende Liste:Wie erhalten Sie die repräsentativsten Funktionen im folgenden tfidf-Modell?
listComments = ["comment1","comment2","comment3",...,"commentN"]
ich ein TFIDF vectorizer erstellt ein Modell aus meiner Kommentare zu erhalten, wie folgt:
tfidf_vectorizer = TfidfVectorizer(min_df=10,ngram_range=(1,3),analyzer='word')
tfidf = tfidf_vectorizer.fit_transform(listComments)
Um nun mehr über mein Modell undestand Ich möchte die repräsentativsten Funktion nutzen zu können, habe ich versucht:
print("these are the features :",tfidf_vectorizer.get_feature_names())
print("the vocabulary :",tfidf_vectorizer.vocabulary_)
und diese mir eine Liste von Worten zu geben, dass ich denke, dass mein Modell verwendet für die ve ctorization:
these are the features : ['10', '10 days', 'red', 'car',...]
the vocabulary : {'edge': 86, 'local': 96, 'machine': 2,...}
Jedoch habe ich einen Weg finden, möchte die 30 repräsentativsten Funktion nutzen zu können, meine ich die Worte, die die höchsten Werte in meinem TFIDF Modell in die Worte mit dem höchsten inversen frecuency las ich erreicht die Dokumentation, aber ich war nicht in der Lage, diese Methode zu finden Ich schätze wirklich Hilfe mit diesem Problem, danke im Voraus,
danke für die Unterstützung, die ich wirklich schätze, – neo33