ich mit sklearn drucken, um tf-IDF-Werte wie folgt zu erhalten.Wie tf-IDF Scores-Matrix in Sklearn in Python
from sklearn.feature_extraction.text import TfidfVectorizer
myvocabulary = ['life', 'learning']
corpus = {1: "The game of life is a game of everlasting learning", 2: "The unexamined life is not worth living", 3: "Never stop learning"}
tfidf = TfidfVectorizer(vocabulary = myvocabulary, ngram_range = (1,3))
tfs = tfidf.fit_transform(corpus.values())
Jetzt möchte ich meine berechneten Tf-IDF-Scores in einer Matrix wie folgt anzeigen.
Ich habe versucht, es wie folgt zu tun.
idf = tfidf.idf_
dic = dict(zip(tfidf.get_feature_names(), idf))
print(dic)
aber dann bekomme ich die Ausgabe wie folgt.
{'life': 1.2876820724517808, 'learning': 1.2876820724517808}
Bitte helfen Sie mir.
Die tatsächliche Ausgabe, die Sie aus dem 'tfidf.fit_transform get()' ist nur in dieser Form. Benötigt werden nur die Spaltennamen, die Sie aus 'tfidf.get_feature_names()' erhalten. Wickeln Sie diese beiden in einen Datenrahmen. –