Ich habe eine große scipy.sparse.csc_matrix
und möchte es normalisieren. Das subtrahiert den Spaltenmittelwert von jedem Element und dividiert durch die Spaltenstandardabweichung (std) i.Wie berechne ich die Varianz einer Spalte einer Sparse-Matrix in Scipy?
scipy.sparse.csc_matrix
hat eine .mean()
aber gibt es eine effiziente Möglichkeit, die Varianz oder Std zu berechnen?
Ich wollte etwas Python-Code posten, um die Varianz vektorisiert zu berechnen, aber wenn Sie es "normalisieren", haben Sie keine Null-Elemente übrig, also sagen Sie uns bitte, dass Sie nichts vermasseln Ihre Sparsity-Struktur sowieso. – seberg
Das ist ein sehr sehr guter Punkt Sebastian, danke. Daran habe ich nicht gedacht. – nickponline