Ich versuche gerade, Text zu klassifizieren. Mein Datensatz ist zu groß und wie vorgeschlagen here, muss ich eine dünne Matrix verwenden. Meine Frage ist jetzt, was ist der richtige Weg, ein Element zu einer dünnen Matrix hinzuzufügen? Sagen wir zum Beispiel, ich habe eine Matrix X, die meine Eingabe ist.SciPy NumPy und SciKit-learn, erstellen Sie eine spärliche Matrix
X = np.random.randint(2, size=(6, 100))
Jetzt sieht diese Matrix X wie ein ndarray eines ndarray (oder etwas ähnliches) aus.
Wenn ich
X2 = csr_matrix(X)
ich die Sparse Matrix haben, aber wie kann ich ein anderes Element in die sparce Matrix hinzufügen? zum Beispiel dieses dichte Element: [1,0,0,0,1,1,1,0, ..., 0,1,0] zu einem spärlichen Vektor, wie füge ich es der Sparse-Eingabematrix hinzu?
(btw, ich bin sehr neu auf Python, scipy, numpy, scikit ... alles)
Sie sollten das wirklich lesen: http://scikit-learn.org/dev/auto_examples/document_classification_20newsgroups.html – zenpoy
Dies ist mein zweiter Tag mit Python arbeiten, das ist ein bisschen übertrieben für einen zweiten Tag zu lesen. Ich fand das auch ttw – Ojtwist
Manche Dinge nehmen sich einfach Zeit. Vielleicht sollten Sie etwas Zeit investieren, um einige Tutorials zu Python, Numpy und Scipy zu machen. Zum Beispiel, in der Antwort in der anderen Frage habe ich Sie auf einige Links hingewiesen, und zenpoy hat Ihnen einen anderen gegeben. Ich nehme an, Sie haben diese Links nicht gelesen, da Sie diese Frage nur wenige Minuten nach der Beantwortung der Frage gestellt haben. – HerrKaputt