Mit sklearn möchte ich 3 Splits (d. H. N_splits = 3) im Beispiel-Dataset haben und ein Train/Test-Verhältnis von 70:30 haben. Ich bin in der Lage, den Satz in 3 Falten zu teilen, aber nicht in der Lage, die Testgröße zu definieren (ähnlich wie bei der train_test_split-Methode). Gibt es eine Möglichkeit, die Test-Stichprobengröße in StratifiedKFold zu definieren?Wie gibt man die Testgröße in geschichtetem kfold Sampling in Python?
from sklearn.model_selection import StratifiedKFold as SKF
skf = SKF(n_splits=3)
skf.get_n_splits(X, y)
for train_index, test_index in skf.split(X, y):
# Loops over 3 iterations to have Train test stratified split
X_train, X_test = X[train_index], X[test_index]
y_train, y_test = y[train_index], y[test_index]