Für den Zweck habe ich die Lösung von diesem Thread link bis jetzt, aber es gibt Speicherfehler wie erwartet, da meine Matrix A Größe 6 Millionen bis 40000 Matrix ist. Daher suche ich nach einer anderen Lösung, um dennoch die Korrelationsmatrix zu approximieren. Wie kann ich dieses Problem impfen? Jede Hilfe wird geschätzt.Wie approximiert man die Korrelationsmatrix in Large Sparse Scipy Matrizen?
5
A
Antwort
1
Ihr Problem ist, dass Sie das Ergebnis nicht im Speicher halten können (6e6^2 Werte?).
Sie können Zeilen aus der ursprünglichen Matrix löschen. Wenn Sie beispielsweise nach stark korrelierten Zeilen suchen, möchten Sie möglicherweise die Zeilen gruppieren, um das Problem zu lösen.
Sie können auch scipy.sparse.linalg.svds
verwenden, um die Anzahl der Spalten zu verringern. Aber Sie müssen immer noch mit den Korrelationen von Zeilen^2 umgehen.
Verwandte Themen
- 1. Scipy Sparse-Matrizen als Eingabe für petsc4py
- 2. Mit scipy sparse Matrizen zu lösen, das System der Gleichungen
- 3. Wie effizient Sparse-Matrizen in Python hinzufügen
- 4. Verbesserung der Leistung der Multiplikation von Scipy Sparse Matrizen
- 5. Wie ändert man Elemente in Sparse-Matrix in Pythons SciPy?
- 6. Wie verkettet man zwei Matrizen in Python?
- 7. Prüfdichte einer Scipy Sparse Matrix
- 8. Scipy Sparse Matrix Alternative für getrow()
- 9. Wie erhält man die Summe jeder Zeile und Summe jeder Spalte in Scipy-Sparse-Matrizen (csr_matrix und csc_matrix)?
- 10. Multithread-Programm für Sparse-Matrizen
- 11. Verketten Sie dünn besetzte Matrizen in Python mit SciPy/Numpy
- 12. Scipy: Ermöglichen dünn besetzte Matrizen erweiterte Indizierung?
- 13. Dreiecks- und Sparse-Matrizen in C++
- 14. Schnelle nicht-negative Matrixfaktorisierung auf Large-Sparse-Matrix
- 15. Python Sparse Matrix dict Konvertieren Sparse Matrix SciPy
- 16. Multi Sparse-Matrizen mit SQL Handhabung
- 17. Konvertieren Scipy Sparse Matrix auf Tupel
- 18. Open MP: Symmetrische Matrixmultiplikation für Sparse-Matrizen
- 19. Kann ich für die allgemeinen Speicheranforderungen eigene Sparse-Matrizen verwenden?
- 20. F-Regression Feature-Auswahl mit Scipy Sparse Arrays
- 21. Scipy dünn besetzte Matrizen - Zweck und Verwendung verschiedener Implementierungen
- 22. Lösen großer linearer Systeme mit Block-Sparse-Matrizen
- 23. Arbeiten mit Textklassifikation und großen Sparse-Matrizen in R
- 24. Finden der Korrelationsmatrix
- 25. Wie berechnet man Cluster-Zuordnungen aus Linkage/Distanz-Matrizen in Scipy in Python?
- 26. zwei numpy Matrizen verbinden
- 27. Sparse Eigenwerte mit Eigen3/Sparse
- 28. Wie stacked mehrere dünn besetzte Matrizen (Feature-Matrizen)?
- 29. Auf der Suche nach einer C/C++ - Schnittstelle für die effiziente Berechnung von Large Sparse Matrix unter Linux
- 30. effiziente Möglichkeit, das Maximum jeder Zeile für Large Sparse-Matrix zu erhalten
Zuerst müssen Sie die folgende Frage beantworten: Wie viele Elemente ungleich Null haben Sie in Ihrer Matrix? Nennen Sie diese Nummer 'nnz'. Der Speicher, der benötigt wird, um sie zu speichern, ist etwa 16e-9 * nnz' Gigabyte. Wie viele Gigabyte würden Sie brauchen? –