Ich habe ein Array von über 2 Millionen Datensätze, jeder Datensatz hat eine 10-Minuten-Auflösung Timestamp im Format datetime.datetime, sowie einige andere Werte in anderen Spalten.Filter numpy Array von Datumsangaben nach Häufigkeit des Auftretens
Ich möchte nur die Datensätze, die Zeitstempel haben, die 20 oder öfter im Array auftreten. Was ist der schnellste Weg, dies zu tun? Ich habe viel RAM, also suche ich nach Verarbeitungsgeschwindigkeit.
Ich habe [] .count() in einem Listenverständnis versucht, aber fing an, den Willen zu leben zu verlieren, darauf wartend, es zu beenden. Ich habe auch versucht, numpy.bincount() aber tragischerweise nicht datetime.datetime
Alle Vorschläge würden sehr geschätzt werden. Danke!
'pandas' könnte möglicherweise in O (n) Zeit, so dass ich das Tag hinzugefügt. –
Können Sie ein sehr kleines Beispiel dafür geben, wie Ihr Array aussieht? 3-4 Elemente sollten uns eine gute Idee geben. – Reti43
Verwenden Sie Pandas und machen Sie eine groupBy auf dem Zeitstempel – reptilicus