ich eine Pipeline sehr ähnlich die in this example gegeben bin mit:abrufen Zwischen Funktionen aus einer Pipeline in Scikit (Python)
>>> text_clf = Pipeline([('vect', CountVectorizer()),
... ('tfidf', TfidfTransformer()),
... ('clf', MultinomialNB()),
... ])
über die ich GridSearchCV
verwenden, um die besten Schätzer über einen Parameter Raster zu finden.
Allerdings würde ich gerne die Spaltennamen meines Trainingssatzes mit der get_feature_names()
Methode von CountVectorizer()
bekommen. Ist dies möglich ohne CountVectorizer()
außerhalb der Pipeline zu implementieren?