2017-04-24 4 views

Antwort

2

Nach dem der xgboost source code documentation Dieser Fehler tritt nur in one place - in einer DMatrix internen Funktion. Hier ist der Quellcode-Auszug:

if len(feature_names) != len(set(feature_names)): 
    raise ValueError('feature_names must be unique') 

Also, der Fehlertext ist ziemlich literal hier; Ihr test_df hat mindestens einen doppelten Feature/Spaltennamen.

Sie haben pandas auf diesem Beitrag getaggt; das schlägt vor test_df ist ein Pandas DataFrame. In diesem Fall DMatrixliterally runs df.columns zu extrahieren feature_names. Überprüfen Sie Ihre test_df für Wiederholungsspaltennamen, entfernen Sie oder benennen Sie sie um und versuchen Sie es dann erneut DMatrix().

-1

Eine Möglichkeit kann dies sein, Spaltennamen zu verwenden, die während der Vorbereitung der Daten eindeutig sind, und dann sollte es funktionieren.

Verwandte Themen