Ich habe gerade mit R angefangen und einige Tutorials abgeschlossen. Ich versuche jedoch in die Zeitreihenanalyse zu kommen und habe große Probleme damit. Ich machte einen Datenrahmen, der so aussieht:R: Wie arbeitet man mit Zeitreihen von Sub-Stunden-Daten?
Date Time T1
1 2014-05-22 15:15:00 21.6
2 2014-05-22 15:20:00 21.2
3 2014-05-22 15:25:00 21.3
4 2014-05-22 15:30:00 21.5
5 2014-05-22 15:35:00 21.1
6 2014-05-22 15:40:00 21.5
Da ich wollte nicht mit einem halben Tag arbeiten, ich den ersten und letzten Tag von dem Datenrahmen entfernt. Da R weder das Datum noch die Zeit als solches erkannte, sondern als "Faktor", benutzte ich die lubridate-Bibliothek, um es richtig zu ändern. Jetzt sieht es so aus:
Date Time T1
1 2014-05-23 0S 14.2
2 2014-05-23 5M 0S 14.1
3 2014-05-23 10M 0S 14.6
4 2014-05-23 15M 0S 14.3
5 2014-05-23 20M 0S 14.4
6 2014-05-23 25M 0S 14.5
Jetzt beginnt das Problem wirklich. Mit der ts-Funktion ändern Sie das Datum auf 16944 und die Zeit auf 0. Wie richte ich einen Datenrahmen mit dem richtigen Startdatum und der richtigen Häufigkeit ein? Ein neuer Satz von Daten kommt in 5 Minuten, also sollte die Frequenz 288 sein. Ich habe auch versucht, das Startdatum als Vektor zu setzen. Da der 142. Tag des Jahres 22. Mai war habe ich versucht, diese
ts_df <- ts(df, start=c(2014, 142/365), frequency=288)
Kein Fehler gibt, aber wenn ich für start(ds_df)
gehe ich bekommen und end(ds_df)
:
[1] 2013.998
[1] 2058.994
Kann mir jemand einen Tipp geben, wie mit diesen Daten arbeiten?
Hallo Grothen, vielen Dank für Ihre schnelle Antwort. Ich brauchte eine Weile, um noch einmal zu antworten, aber du hast viel geholfen. – ngn16920