Betrachten Sie dieses Szenario, wir sammeln Finanzmarktdaten (z. B. den Preis des Fonds) und speichern sie in einer SQL-Tabelle.Ist Cassandra eine gute Wahl für diese Art von Zeitreihendaten vs SQL-Server?
Normalerweise Fondspreise höchstens einmal am Tag, so kann der Tisch sein:
FundId Date Price1 Price2
Wenn wir einige Daten wollen, eine einfache Abfrage tun:
select Date, Price1, Price2 from FundPriceTable where Date between XX and XX
Doch wie wir gesammelt mehr und mehr Daten, begann die obige Abfrage Leistung zu sinken. Wir haben versucht, die Statistiken neu zu indizieren und zu aktualisieren. Das Problem ist, dass wenn wir eine große Menge an Daten abrufen (z. B. 10 Jahre Geschichte für 1000 Fonds), kann es eine Weile dauern.
Ich frage mich für dieses Szenario (kein Beitritt überhaupt), wird System wie Cassandra irgendwelche Leistungsvorteile zeigen (gleiche Hardware vorausgesetzt)?
Ich habe versucht, einige Benchmark-Artikel zwischen Cassandra und SQL Server für Zeitreihen zu finden, leider nichts gefunden.
Danke, ich mache ein paar erste Nachforschungen, so Setup wie Sie gesagt, wird einige Zeit dauern. Werden die drei Abfragen, die Sie erwähnt haben, gleichzeitig automatisch ausgeführt oder müssen Sie in meinem Code mehrere Threads erstellen? – daxu
Hängt von Ihrer Sprache ab, aber Sie können den gesamten Code asynchron abfragen. Ich arbeitete mit dem scala, php und nodejs Treiber und in allen Treibern ist eine asynchrone Option. –