2017-09-20 3 views
-1

Ich verwende logistische Regression und Linear SVC aus scikit für die Kategorisierung eines Dokuments in 2 Kategorien von Etikett 0 und Etikett 1. Ich TFIDF Vectorizer bin mit für Feature-Auswahl bezeichnet lernen, und ich habe alle Nicht-Null-Funktionen von Testdokument extrahiert mit Transform-Funktion von TFIDF Vectorizer darauf und jetzt möchte ich wissen, ob eine bestimmte Funktion für Label 1 oder Label 0 verwendet wird.Wie erkennt man die Relevanz eines Features in einem beliebigen Modell in ScikitLearn?

Grundsätzlich möchte ich wissen, ob meine Klassifikator gibt mir Antwort als Label 0, dann basiert Auf welche Eigenschaften hat es diese Antwort gegeben.

Antwort

0

Mit der Funktion get_feature_names() können Sie die Feature-Namen extrahieren. Sie erhalten eine Array-Zuordnung für Feature-Indizes zu Feature-Namen. Sie können mehr darüber lesen here.

This example erläutert, wie die Objektnamen gedruckt werden.

Sie können die entsprechenden Relevanzwerte von this link erhalten. Gehen Sie zum Abschnitt mit dem Titel: Sinn der Tf-IDF-Matrix. Sie werden sehen, dass feature_names() verwendet wird, um die oberen Werte zu extrahieren.

EDIT: Verschiedene Klassifizierer haben verschiedene Möglichkeiten Feature Relevanzen zu extrahieren. Sie können SelectFromModel in sklearn verwenden, um die Features basierend auf dem ausgewählten Klassifikator zu extrahieren. Sie können die get_support Funktion verwenden, um die Feature-Indizes abzurufen. Here ist ein Beispiel für das gleiche.

+0

verwenden, dass ich nur die Funktion Namen herausfinden kann, aber ich will Relevanz dieses Merkmals durch Klassifizierer verwendet wissen, um das Ergebnis zu erzeugen. –

+0

@ShubhamGarg Es tut mir leid, ich habe Ihre Frage missverstanden. Ich habe meine Antwort aktualisiert. Sehen Sie, ob das hilft. –

+0

Tatsächlich habe ich das Attribut coef_ verwendet, das in scikit-Klassifizierern vorhanden ist, um die Relevanz des Merkmals für diesen Klassifizierer herauszufinden. –

Verwandte Themen