Ich habe eine große Stichprobe von Zeitstempel GPS-Daten für eine Reihe von Fahrzeugen im Textdateiformat. Jede Fahrzeugdaten hat eine eindeutige ID. Ich habe einfach einen Pandas-Datenrahmen erstellt und dann festgestellt, dass die GPS-Daten jedes einzelnen Fahrzeugs mehrere Monate lang durchgehend sind.Aufteilen kontinuierlicher GPS-Daten in separate Fahrten
Ich möchte einzelne Reisen isolieren, indem ich die Strecke spalte, wo die Lücke in der GPS-Berichterstattung ein bestimmtes Delta überschreitet (z. B. 10 Minuten). Ich glaube nicht, dass ich davon ausgehen kann, dass sich die Position zwischen dem Ende einer Reise und dem Beginn der nächsten nicht ändert (obwohl es sehr nah ist).
uid ts lat lon
ABC 2017-01-01 00:00:00 0.0000 0.0000
ABC 2017-01-01 00:00:05 0.0000 0.0100
ABC 2017-01-01 00:00:10 0.0000 0.0200
ABC 2017-01-01 00:10:00 0.0100 0.0300 <--- New Journey. 10 min delta
ABC 2017-01-01 00:10:05 0.0100 0.0400
ABC 2017-01-01 00:10:10 0.0100 0.0500
ABC 2017-01-01 00:10:15 0.0100 0.0600
DEF 2017-01-01 20:00:00 1.0000 1.0000
DEF 2017-01-01 20:00:05 1.0000 1.0100
DEF 2017-01-01 20:00:10 1.0000 1.0200
DEF 2017-01-01 20:20:00 1.0100 1.0300 <--- New Journey. 20 min delta
DEF 2017-01-01 20:20:05 1.0100 1.0400
DEF 2017-01-01 20:20:10 1.0100 1.0500
DEF 2017-01-01 20:20:15 1.0100 1.0600
Kann mir jemand vorschlagen, wie ich effizient getrennte Reisen isolieren könnte? Eine Lösung mit Pandas ist absolut nicht notwendig.
Wie die neuen Daten aussehen würde? Wir sind "Isolate Individualreisen". – Grimmy
Ich bin offen für irgendwelche Vorschläge. Vielleicht könnte der UID eine Reise-ID in einer neuen Textdatei angehängt werden? ABC-001, ABC-002? Eine neue Spalte in den Daten, die eine ID der Reise angibt? Oder sogar Hilfe, wie eine Pandas-Abfrage zum Teilen von Daten aussehen könnte. – Dan