2016-04-22 9 views
0

Ich versuche, Vorhersagen mit drei verschiedenen Sensordaten zu treffen. Jeder Sensor hat eine Periodizität, und die Messzeitpunkte sind nicht gleich (z. B. sensor1data_time = 10: 01; sensor2data_timestamp = 10:03; sensor3data_timestamp = 10:05).RapidMiner TimeStamp Vorverarbeitung

Ich habe diese Aufgabe manuell für eine Demo gemacht, aber jetzt muss ich es automatisieren, um ein Vorhersagemodell zu entwickeln.

Jede Vorverarbeitungsaufgabe empfohlen?

Vielen Dank im Voraus

Antwort

2

würde ich das mal so etwas wie die nächsten 10 Minuten abrunden. Der zu verwendende Bediener ist Generate Attributes. Ich neige dazu, die Anzahl der Sekunden seit 01.01.1970 zu verwenden. Die folgenden Fragmente zeigen die Funktionen, die Sie verwenden können. Ich nehme an, Sie haben ein Attribut namens datetr mit einem Datum in dieser Art von Format 13-01-2016 23:01:01.

attribute name function expression  
------------------------------------------------------------------- 
date    date_parse_custom(datestr, "dd-MM-yyyy HH:mm:ss") 
epochdate   date_diff(date_parse(0), date)/1000 
dateToTenMins  600*round(epochdate/600) 

Das Datum der Epoche ist in Millisekunden, also gibt die Division durch 1000 Sekunden.

+0

Ich sehe was du meinst. Danke für Ihre Hilfe. Wenn jedoch mehr als ein Wert auf denselben Zeitstempel gerundet wird, könnte ich den Operator 'FilterExamples' verwenden, um doppelte Werte zu löschen? – Havor

+0

Sie könnten den Operator "Aggregat" verwenden, um die Anzahl der Beispiele mit demselben Zeitstempel zu zählen. Sie würden erwarten, für jeden Zeitstempel von jedem Sensor 1 zu sehen. – awchisholm

+0

Wirklich hilfreich Ihr Ratschlag :) Nur noch eine Frage. Ich verstehe nicht, warum Sie die '600' benutzen. Ich meine, wenn, anstatt auf die nächsten fünf Minuten zu runden, für den Fall, dass ich mich auf die untere Stunde konzentrieren wollte ?? Zum Beispiel, wenn für 1:03 und 1:53 ich für beide von ihnen 1:00 bekommen möchte? Wie könnte ich das tun ?? – Havor