Ich klassifiziere kleine Texte (Tweets) mit Naive Bayes (MultinominalNB) in Scikit-lernen. Meine Zugdaten haben 1000 Features und meine Testdaten haben 1200 Features. Angenommen 500 Funktionen sind sowohl für Zug- als auch für Testdaten üblich.Naive Bayes unsichtbare Funktionen Handhabung scikit lernen
Ich frage mich, warum MultinominalNB in scikit lernen nicht ungesehen Funktionen handhaben, und gibt mir eine Fehlermeldung:
Traceback (most recent call last):
File "/Users/osopova/Documents/00_KSU_Masters/01_2016_Spring/Twitter_project/mda_project_1/step_4.py", line 60, in <module>
predict_Y = classifiers[i].predict(test_X)
File "/Library/Python/2.7/site-packages/sklearn/naive_bayes.py", line 65, in predict
jll = self._joint_log_likelihood(X)
File "/Library/Python/2.7/site-packages/sklearn/naive_bayes.py", line 672, in _joint_log_likelihood
return (safe_sparse_dot(X, self.feature_log_prob_.T)
File "/Library/Python/2.7/site-packages/sklearn/utils/extmath.py", line 184, in safe_sparse_dot
return fast_dot(a, b)
ValueError: matrices are not aligned