2016-05-26 22 views
0

Wir sind dabei, SaaS- und PaaS-Anbieter für den SMACK-Technologie-Stack zu evaluieren.Spark, Cassandra und Kafka (SMACK) SaaS- oder PaaS-Anbieter

Wir möchten die Knoten in AWS hosten.

Bisher haben wir folgende Alternativen gefunden:

  • DCOS (https://dcos.io/)

  • Instaclustr (https://www.instaclustr.com/)

  • AWS EC2 - wir müssten manuell den Einsatz tun und Verwaltung

  • Datastax (es hat nur Cassandra, wir würden muss Spark und Kafka bereitstellen. Gemäß der Dokumentation ist es in Datastax Analytics recht einfach, Spark zu implementieren. Das Problem ist auch, dass in der letzten Version von DataStax Enterprise-Version von Funken nicht 1.6 ist (ich glaube, es ist 1.4)

Gibt es mögliche Alternativen dazu?

Wie lange würden wir (Anfänger) benötigen, um Option 3 (AWS ec2) bereitzustellen, und wie viel Administrationszeit danach erforderlich ist? Wie einfach ist die Skalierung danach?

Natürlich erwarte ich keine konkreten Zahlen und Zahlen, nur allgemeine Meinungen und Ratschläge von denen, die den gleichen Prozess gemacht haben.

Danke

Antwort

0

Bis Mesos-1554 festgelegt ist ich auf Mesos aus Performance-Gründen nicht ausgeführt c * oder DSE empfehlen.

Nach der Dokumentation, in Datastax Analytics ist es ziemlich einfach, bereitstellen Spark).

DSE wird tatsächlich mit Funken geliefert, keine Integration erforderlich.

Problem ist auch, dass in der letzten Version von DataStax Enterprise-Version von Spark ist nicht 1.6 (ich glaube, es ist 1,4)

DSE 5.0 wird mit Funken 1.6.x versenden und es wird GA sein ziemlich bald.

Wie lange „würde es uns nehmen“ (Anfänger-Benutzer) Option 3 (AWS EC2) bereitstellen, sowie wie viel Verwaltungsaufwand erforderlich ist danach? Wie einfach ist die Skalierung danach?

Dies ist keine leichte Frage, um objektiv zu antworten. Nehmen Sie den Opps-Kurs kostenlos auf der datastax academy und bestimmen Sie selbst, ob Sie für den Einsatz bereit sind. https://academy.datastax.com/courses/ds210-operations-and-performance-tuning

+0

Vielen Dank für Ihre Antwort. Welcher Cluster Manager DSE verwendet? Wann ist das erwartete Ausgabedatum von DSE 5.0? Gibt es Kafka-Deployment-Anweisungen? –

+0

Standalone +, DSE hat einen Zookeeperless-HA-Funken-Master, der mit Paxos implementiert wird. Kein festes Datum, das ich teilen kann, aber für eine Ankündigung auf dem Laufenden bleiben. Die kafka/dse-Integration ist ziemlich geradlinig. Hier ist ein Beispiel https://github.com/retroryan/spark_streaming_aggregation – phact

+0

Sorry, ist es möglich, diese Frage bitte zu sehen: http://stackoverflow.com/questions/37482585/datastaxenteprise-node-vs-instance-correct-ami -image-why-do-i-need-storage Wir sind ernsthaft an Datastax interessiert, aber ohne Antworten auf diese Fragen kann ich meinen Vorgesetzten nicht versichern, dass Datastax die richtige Wahl ist. Vielen Dank –

Verwandte Themen