Ich sehe mir ein Projekt an, bei dem ich hunderte Messwerte pro Tag von einem Sensor speichern müsste (1/min). Der Wert, den ich in die Datenbank eingeben möchte, enthält einige Ganzzahlen, eine Sensor-Seriennummer, einen Zeitstempel und eine UID. Das Problem ist, dass ich diese auch schnell lesen kann.Die beste Art, Sensordaten für schnelle Lesevorgänge zu speichern
Ich muss in der Lage sein, die letzten n Messwerte (die letzten 500 oder 1000 Messwerte) grafisch darzustellen und nach Sensorseriennummer zu sortieren. Wenn ich 1000 Sensoren habe, die jede Minute Daten senden, dann sind das 1,44 Millionen Datensätze pro Tag, und in ein paar Jahren werden Milliarden von Datensätzen entstehen.
Was ist der beste Weg, um diese Daten zu speichern, so dass ich schnell auf die Daten zugreifen kann, aber immer noch große Mengen davon speichern?
Wenn meine Ingenieure das vergangene Jahr von Daten von einem Sensor oder von ein paar Sensoren sehen wollen, sind das 525.600 Datenzeilen. Wie schnell würde ich das verarbeiten können? Millisekunden? Std? Tage?
Der Grund, warum ich die Daten aufbewahren muss, ist, dass ich in der Lage sein muss, Gleichungen zu verwenden, um zukünftige Sensordaten vorherzusagen. Mach vielleicht auch Maschinen lernen. Wäre es von Vorteil, diese Daten nach ein oder zwei Jahren offline zu speichern, um Speicherplatz zu sparen, oder spielt dies für k/v-Datenbanken keine Rolle?
Zuerst dachte ich RDB, aber da wir den Wachstumsfaktor wollen, scheint die k/v/noSQL-Datenbank der Weg zu sein. Ich plante, amazon DynamoDB zu hosten und eine Webapp, um die Daten zu sehen.
Was ist eine große Datenbank? Tausende von Reihen, Millionen, Milliarden? Wo ist der Punkt, wo es zu groß wird, um damit umzugehen?
Ich weiß, dass es viele vage Fragen gibt. Jede Antwort und jeder Ratschlag wäre willkommen.
Klingt nach einem sehr interessanten Ansatz. Wusste nicht über Rotverschiebung ... Das würde eigentlich sehr gut funktionieren. Das Ziel ist, vorherzusagen, was die Sensoren einige Tage voraus lesen werden, basierend auf vorherigen Wochen oder Jahren.Aber der wichtigste Teil im Moment ist es, nur zu sehen, was die Sensoren basierend auf dem Standort lesen, und auch ein paar Tage vorheriger Daten zu geben. –