Wenn die Frequenz der Klasse A 10% beträgt und die Frequenz der Klasse B 90% beträgt, dann wird die Klasse B die dominant geworden Klasse und der Entscheidungsbaum wird zu den Klassen voreingenommen werden, die
In diesem Fall dominant sind, können Sie ein dic {A:9,B:1}
zum Modell passieren das Gewicht jeder Klasse zu spezifizieren, wie
clf = tree.DecisionTreeClassifier(class_weight={A:9,B:1})
Die class_weight='balanced'
wird auch funktionieren, es einfach automatisch Gewichte
nach dem Anteil jeder Klasse Frequenzen einstellt
Nachdem ich class_weight='balanced'
verwenden, die Satznummer jeder Klasse ist gleich geworden (um 88923)
Bitte beachten Sie, dass es sich um einen Parameter des Klassifikators (des Konstruktors) handelt, nicht von 'fit'. –