Ich fange gerade an, mit Mahout zu arbeiten, und eine Sache, die mich sehr verwirrte, ist das Fehlen der linearen Regression. Sogar die logistische Regression, die viel schwieriger ist, wird bis zu einem gewissen Grad durch die Forschung unterstützt, aber es ist alles still bezüglich der linearen Regressionsfront!Warum Mahout noch keine lineare Regression hat
Von dem, was ich verstehe, OLS ist eine der einfachsten Probleme zu lösen -
Y = Xb + e
eine lineare Regressions Lösung von b = (X^TX)^(- 1) X^TY, wobei X^T die Transponierte von X ist, und wenn die Matrix (X^TX) singulär (dh nicht invertierbar) wird, ist es vollkommen in Ordnung, eine Fehlermeldung zu zeigen, obwohl eine Lösung mit verallgemeinerter Invertierung existiert.
Berechnung von sowohl X^T X und X^Y sind nur Berechnungen von Summen und Summe von Produkten von Elementen, was wahrscheinlich die einfachste Sache mit MapReduce ist, wie ich es verstehe.
(Was mich denken lässt ... gibt es ein Modul, die native Matrix-Operationen erforderlich unterstützt Regression cofficients zu berechnen? Das wäre ein Regressionsmodul unnötig in der Tat machen ...)
bin ich etwas fehlt, die Regression macht schwer in Mahout zu berechnen?
@kalEl weiterhin - Mahout ist ein Open-Source-Projekt, wenn Sie denken, dass es so einfach ist, fügen Sie es einfach selbst hinzu –