Ich verwende PCA, um Dokumente auf 2 Punkte zu reduzieren, damit ich sie visualisieren kann. Meine Methode sieht so aus.Hinzufügen eines Punktes zu einem PCA-Modell
pipeline = Pipeline([('tfidf', TfidfVectorizer())])
X = pipeline.fit_transform(sent_list).todense()
pca = PCA(n_components = 2).fit(X)
data2D = pca.fit_transform(X)
Dann habe ich ihnen bin Plotten matplotlib mit plt.scatter (data2D [: 0], data2D [: 1], c = label_colour)
I 2 neue Punkte hinzufügen möchten, und sehen wo sie in das Modell fallen. Bis heute habe ich die Anfangspunkte in die Trainingsdaten am Ende aufgenommen und ein X über die letzten beiden Positionen im Array gezeichnet, aber ich bin mir nicht sicher, ob dies eine wahre Reflektion ihres Wertes ist. Jede Einsicht wäre großartig.