2016-06-03 4 views
0

Mit Python, was ist die beste Möglichkeit, eine erschöpfende Suche nach den besten Teilmengen der Variablen in x für die Vorhersage y in lineare Regression durchzuführen? R hat beispielsweise ein Paket mit der Bezeichnung leaps, das einen effizienten Branch-and-Bound-Algorithmus verwendet.Subset-Regression in Python über erschöpfende Suche

Antwort

-1

Sie können die schrittweise Auswahl mit der Funktion step() vornehmen. Das Paket MASS hat auch die Funktion stepAIC(). Ich glaube, dass Sie das sind, wonach Sie suchen. Standardmäßig sucht step() sowohl vorwärts als auch rückwärts mit einer standardmäßigen maximalen Anzahl von Schritten = 1000, was ausreichen sollte. Sie können auch die Anzahl der Schritte ändern. Details finden Sie unter ?step().

1

Leider gibt es einige R-Pakete, die nicht die gleichen Python-Pakete haben. R ist eine viel reifere Sprache, wenn es um Statistiken geht.

Ich verwende häufig RPy2, um R-Pakete in meine Python-Arbeit zu integrieren. Es scheint, dass es auch für Ihr gewünschtes Sprüngepaket funktionieren würde.