2014-06-14 9 views
6

http://pubapi.cryptsy.com/api.php?method=marketdatav2Wie Marktdaten synchronisieren und häufig zeigen als historische Daten Zeitreihen

Ich möchte Marktdaten auf einer kontinuierlichen Basis synchronisieren (z cryptsy und anderen Vermittlungsstellen). Ich möchte den aktuellen Kauf-/Verkaufspreis aus den jeweiligen Aufträgen dieser Börsen regelmäßig als historische Zeitreihe darstellen.

Welche Backend-Datenbank sollte ich verwenden, um einen Parameter aus den abgerufenen Daten als historische Zeitreihendaten zu speichern und zu plotten.

+0

Schätzen Sie alle Eingaben zu vermeiden, wird verhindert, dass auf diese – Rpj

+0

Können Sie mehr Informationen über die zugrunde liegenden Parameter?Sie geben an, dass Sie (a) Daten kontinuierlich synchronisieren, (b) von externen Quellen, (c) Daten speichern und (d) Daten in verschiedenen Zeitreihenformaten ausgeben möchten. Ist die Frage, welche Datenbank so viele Daten speichern kann, wie sie zunimmt, welche wird schnell aktualisiert, wenn sie ankommt, welche ist am besten für Zeitreihendaten geeignet, oder was? Von Ihrer Frage bis jetzt ist es schwer für mich zu glauben, dass Sie sicher sind, was Sie mit den Daten anfangen sollen, sobald sie gespeichert sind. – Anthony

+0

Wenn Ihre Daten bereits Zeitstempel haben, schieben Sie den JSON einfach in eine CouchDB-Datenbank und gehen Sie dann zur wahrscheinlichsten Frage über: "Was ist der beste Weg, um diese Daten abzurufen?" – Anthony

Antwort

0

Ich würde vorschlagen, dass Sie sich eine Datenbank ansehen, die für die Verarbeitung von Zeitreihendaten optimiert ist. Der eine, der in den Sinn kommt, ist InfluxDB. This question hat eine allgemeinere Zeitreihen-Datenbank.

0

Ich denke, es braucht mehr Details über die Anforderung. Es beschreibt nur, "es benötigt Synchronisierungszeitreihendaten". Was ist ein Szenario? Was ist Datenquelle und Ziel?

Option 1.

Wenn es nur Datensynchronisationsprobleme zwischen zwei Daten basiert, einfachste Lösung ist CouchDB NoSQL Series (CouchDB, Couchbase, Cloudant)

Alles, was sie auf CouchDB basieren, trotzdem Sie bieten Data-Center-Level-Datenreplikationsfunktion (XCDR). So können Sie das Datum auf andere CouchDB in anderen Rechenzentren oder sogar in CouchDB in mobilen Geräten replizieren.

Ich hoffe, es wird Ihnen nützlich sein.

Option 2.

Anderer Ansatz Ansatz zur Datenintegration. Sie können Daten mithilfe von ETL-Stapeljobs synchronisieren. Batch Worker kann Daten regelmäßig zum Ziel kopieren. Dies ist der gebräuchlichste Weg, Daten zu einem anderen Ziel zu replizieren. Es gibt eine Menge von Werkzeugen unterstützt ETL-Linie Pentaho ETL, Spring Integration, Apache Camel.

Wenn Sie mir ausführliches Szenario bieten, kann ich u helfen, genauer

Genießen -Terry

+0

Couchbase basiert auf Membase * nicht * auf CouchDB. Sie sind signifikant verschiedene Technologien. http://www.couchbase.com/couchbase-vs-couchdb –

0

Ich denke mongoDB ist eine gute Wahl. Hier ist warum:

  1. Sie können problemlos horizontal skalieren und können daher enorme Datenmengen speichern. Wenn Sie einen entsprechenden Shard-Schlüssel verwenden, können Sie die Shards möglicherweise sogar in der Nähe des Austauschs platzieren, an den sie sich anschließen, um die Geschwindigkeit zu erhöhen, falls dies zu einem Problem werden sollte.
  2. Replikatsätze bieten automatisches Failover, das implizit ein Problem darstellen könnte
  3. Mithilfe der TTL-Funktion können Daten nach ihrer TTL automatisch gelöscht werden, wodurch effektiv eine Round-Robin-Datenbank erstellt wird.
  4. Sowohl die Aggregation und die Map/Reduce Rahmen wird hilfreich sein
  5. Es gibt einige kostenlose Kurse an MongoDB-Universität, die Ihnen die häufigsten Fallen
Verwandte Themen