Ich habe sklearn verwendet, um einige Daten zu lernen. Dies ist eine binäre Klassifikationsaufgabe und ich verwende einen RBF-Kernel. Mein Datensatz ist ziemlich unausgewogen (80:20) und ich verwende nur 120 Samples mit 10ish Features (ich experimentiere mit ein paar weniger). Seit ich class_weight="auto"
gesetzt habe, ist die Genauigkeit, die ich aus einem kreuzvalidierten (10-fachen) Gridsearch berechnet habe, dramatisch gesunken. Warum??Die Verwendung von Klassengewicht zum Ausgleich von Datensätzen verringert die Genauigkeit in RBF SVM
Ich werde ein paar Validierungsgenauigkeit Heatmaps enthalten, um den Unterschied zu demonstrieren.
HINWEIS: top Heatmap ist vor classweight auf Auto geändert wurde.
Ich habe die wahre positive Rate überprüft, sowie die genaue Leistung analysiert und vor der Änderung des Klassengewichts der Prädiktor (höchstens) 5 oder 6 der 24 in der Minderheit Gruppe. Nach dem Ändern ist es aber noch mehr als eins zu bekommen – bidby