2017-08-04 2 views
0

Ich erstelle ein Entscheidungsbaummodell und trainiere es mit einem Datensatz.Wie man Datum/Zeitstempel in meine Funktionen einbezieht

Allerdings sind einige der Spalten in diesem Datensatz entweder Timestamps oder Datum. Ich habe die Dokumentation von Apache durchgesehen und konnte keine Möglichkeit finden, diese Werte in meine Spalte features zu analysieren oder hinzuzufügen.

Irgendeine Idee von, wie ich es tun kann?

+0

Oft ist es sinnlos, diese Felder für einen Klassifikator zu verwenden. Sind Sie sicher, dass Sie nützliche Funktionen in diesen Feldern haben? –

+0

Ja. Normalerweise legt der Endbenutzer fest, welche Spalten nach Anomalien suchen, wenn mein Programm läuft. Ein mögliches Szenario kann sein, dass, wenn ein Datum in einer Spalte einen bestimmten Schwellenwert überschreitet, dieser Wert als schlecht betrachtet werden sollte und mein Entscheidungsbaum den Grund für diesen Fehler sehen und verstehen muss, weshalb ich das Datum angeben muss in meinen Funktionen Vektor –

+0

@ user8371915 ist es kein Duplikat, weil niemand diese Frage beantwortet hat. Diese Antwort wurde nicht akzeptiert, und auch die dort veröffentlichte Lösung ist nur für Scala, nicht für Python. –

Antwort

0

Im Grunde müssen Sie sie in Funktionen verwandeln. Eine Möglichkeit besteht darin, Dummy-Variablen mit Dingen wie Jahr, Monat, Woche oder sogar Wochenend-Stunden zu erstellen. Es hängt davon ab, welche Funktionen Sie für Ihr Problem erstellen möchten.

+0

Das könnte funktionieren, aber es wird eine Menge Verarbeitung erfordern, besonders weil Zeitstempel auch Stunden, Minuten und Sekunden haben. Ich dachte, den Zeitstempel zu einem Integer umzuwandeln, aber idk, wie vernünftig ist das –

+0

Ja, deshalb hängt es von deinem spezifischen Problem ab, wenn du nur Stunden am Tag interessierst, dann kannst du die Stunden von deinem Zeitstempel extrahieren und 24 schaffen Dummy-Variablen mit allen Stunden drin. Mit Daten können Sie auch mehrere Funktionen erstellen, Wochenende/nicht Wochenende, Wochentag (1-7), Monat (1-12) etc usw. Nun, wenn Ihr Problem Details zur Minute und Sekunde der Zeit benötigt, können Sie Auch die Zeit des Tages wird in eine Ganzzahl umgewandelt, die Sekunden von der 0 Stunde zählt, die zum Beispiel helfen könnte. –

Verwandte Themen