Ich möchte eine Feature-Auswahlmethode verwenden, bei der "Kombinationen" von Features oder "zwischen Features" Interaktionen für eine einfache lineare Regression berücksichtigt werden.SKlearn (scikit-learn) multivariate Feature-Auswahl für Regression
SelectKBest betrachtet nur jeweils eine Funktion für das Ziel und ordnet sie nach Pearsons R-Werten an. Das ist zwar schnell, aber ich fürchte, es ignoriert einige wichtige Interaktionen zwischen Funktionen.
Rekursive Feature Elimination verwendet zuerst alle meine Features, passt auf ein lineares Regressionsmodell und startet dann das Feature mit dem kleinsten absoluten Wertkoeffizienten. Ich bin mir nicht sicher, ob dies für die Interaktion zwischen den Features verantwortlich ist ... Ich denke nicht, da es einfach den kleinsten Koeffizienten nacheinander auswirft, bis er die angegebene Anzahl von Features erreicht.
Was ich suche ist, für die erfahrenen Feature-Auswahl Wissenschaftler da draußen, eine Methode, um die beste Teilmenge oder Kombination von Features zu finden. Ich lese alle Feature Selection-Dokumentation durch und kann keine Methode finden, die beschreibt, was ich vorhabe.
Alle Tipps werden sehr geschätzt werden !!!!!!
Zuerst sollten Sie die Varianz-Kovarianz-Plots beobachten. Dies gibt Ihnen ein Gefühl der paarweisen Korrelation zwischen Ihren Funktionen. – ketan