Nach dem der xgboost
source code documentation Dieser Fehler tritt nur in one place - in einer DMatrix
internen Funktion. Hier ist der Quellcode-Auszug:
if len(feature_names) != len(set(feature_names)):
raise ValueError('feature_names must be unique')
Also, der Fehlertext ist ziemlich literal hier; Ihr test_df
hat mindestens einen doppelten Feature/Spaltennamen.
Sie haben pandas
auf diesem Beitrag getaggt; das schlägt vor test_df
ist ein Pandas DataFrame
. In diesem Fall DMatrix
literally runs df.columns
zu extrahieren feature_names
. Überprüfen Sie Ihre test_df
für Wiederholungsspaltennamen, entfernen Sie oder benennen Sie sie um und versuchen Sie es dann erneut DMatrix()
.