In Sklearn kann GridSearchCV eine Pipeline als Parameter verwenden, um den besten Schätzer durch Kreuzvalidierung zu finden. Jedoch ist die übliche Kreuzvalidierung wie folgt aus: Wie man Walk-Forward-Tests in Sklearn implementieren?
zu überqueren eine Zeitreihendaten zu validieren, die Trainings- und Testdaten werden häufig wie folgt aufgeteilt:
Das heißt, sollten die Testdaten werden immer vor Trainingsdaten.
Mein Gedanke ist:
schreiben meine eigene Version Klasse von k-fach und weitergeben GridSearchCV so kann ich die Bequemlichkeit der Pipeline genießen. Das Problem ist, dass es schwierig erscheint, GridSearchCV bestimmte Trainings- und Testdaten zu verwenden.
Schreiben Sie eine neue Klasse GridSearchWalkForwardTest, die GridSearchCV ähnlich ist, studiere ich den Quellcode grid_search.py und finde es ein wenig kompliziert.
Jeder Vorschlag ist willkommen.
Siehe https://github.com/scikit-learn/scikit-learn/issues/3202 – yangjie