Ich schaue auf dieses Tutorial: https://www.dataquest.io/mission/74/getting-started-with-kaggleWas macht KFold in Python genau?
Ich habe zu Teil 9, Vorhersagen zu machen. Dort gibt es einige Daten in einem Datenrahmen genannt titanic, die dann in Falten oben mit unterteilt:
# Generate cross validation folds for the titanic dataset. It return the row indices corresponding to train and test.
# We set random_state to ensure we get the same splits every time we run this.
kf = KFold(titanic.shape[0], n_folds=3, random_state=1)
ich es genau tut und was Art nicht sicher bin, was ist der Gegenstand kf. Ich habe versucht, die Dokumentation zu lesen, aber es hat nicht viel geholfen. Auch gibt es drei Falten (n_falten = 3), warum ist es später nur Zugriff Zug und Test (und wie kann ich wissen, dass sie Zug und Test genannt werden) in dieser Linie?
for train, test in kf:
Ich verstehe es. Was auch immer n_folds ist, Sie haben immer noch nur ein Test- und ein Trainingset. Wenn n_folds 2 ist, dann verwenden Sie nur die Hälfte der Daten für das Training und die andere Hälfte für das Testen, und tauschen Sie sie dann aus. Verstehe ich das richtig? – user
Ja. Sie erhalten die i'th (1 <= i <= n_fold) Falte als Test und verbleibende Falten als Training. – qmaruf