Codierte kategoriale Features in h2o in Python

Gibt es eine Möglichkeit zu sehen, wie die kategorischen Features codiert werden, wenn wir es h2o erlauben, kategorische Daten automatisch zu erstellen, indem wir eine Spalte in enum schreiben?Codierte kategoriale Features in h2o in Python

Ich implementiere Holdout-Stacking, wobei meine zugrunde liegenden Trainingsdaten für jedes Modell unterschiedlich sind. Ich habe ein gemeinsames Feature, das sicherstellen soll, dass es in beiden Sets gleich codiert ist. Die Funktion enthält Namen (str). Es ist garantiert, dass alle Namen, die in einem Datensatz erscheinen, in dem anderen angezeigt werden.

Quelle

2017-09-20 joceratops

Der beste Weg, um in einem Modell zu sehen, ist das Exportieren der Pojo, und schauen Sie sich den Java-Quellcode an. Sie sollten sehen, wie Enums verarbeitet werden.

Aber wenn ich den Rest Ihrer Frage richtig verstehe, sollte es in Ordnung sein. Solange die Trainingsdaten alle möglichen Werte einer Kategorie enthalten, wird es wie erwartet funktionieren. Wenn ein kategorischer Wert, der im Training nicht zu sehen ist, in der Produktion präsentiert wird, wird er als NA behandelt.

Quelle

2017-09-22 07:40:08

Codierte kategoriale Features in h2o in Python

Antwort

Verwandte Themen