Wir sind dabei, SaaS- und PaaS-Anbieter für den SMACK-Technologie-Stack zu evaluieren.Spark, Cassandra und Kafka (SMACK) SaaS- oder PaaS-Anbieter
Wir möchten die Knoten in AWS hosten.
Bisher haben wir folgende Alternativen gefunden:
DCOS (https://dcos.io/)
Instaclustr (https://www.instaclustr.com/)
AWS EC2 - wir müssten manuell den Einsatz tun und Verwaltung
Datastax (es hat nur Cassandra, wir würden muss Spark und Kafka bereitstellen. Gemäß der Dokumentation ist es in Datastax Analytics recht einfach, Spark zu implementieren. Das Problem ist auch, dass in der letzten Version von DataStax Enterprise-Version von Funken nicht 1.6 ist (ich glaube, es ist 1.4)
Gibt es mögliche Alternativen dazu?
Wie lange würden wir (Anfänger) benötigen, um Option 3 (AWS ec2) bereitzustellen, und wie viel Administrationszeit danach erforderlich ist? Wie einfach ist die Skalierung danach?
Natürlich erwarte ich keine konkreten Zahlen und Zahlen, nur allgemeine Meinungen und Ratschläge von denen, die den gleichen Prozess gemacht haben.
Danke
Vielen Dank für Ihre Antwort. Welcher Cluster Manager DSE verwendet? Wann ist das erwartete Ausgabedatum von DSE 5.0? Gibt es Kafka-Deployment-Anweisungen? –
Standalone +, DSE hat einen Zookeeperless-HA-Funken-Master, der mit Paxos implementiert wird. Kein festes Datum, das ich teilen kann, aber für eine Ankündigung auf dem Laufenden bleiben. Die kafka/dse-Integration ist ziemlich geradlinig. Hier ist ein Beispiel https://github.com/retroryan/spark_streaming_aggregation – phact
Sorry, ist es möglich, diese Frage bitte zu sehen: http://stackoverflow.com/questions/37482585/datastaxenteprise-node-vs-instance-correct-ami -image-why-do-i-need-storage Wir sind ernsthaft an Datastax interessiert, aber ohne Antworten auf diese Fragen kann ich meinen Vorgesetzten nicht versichern, dass Datastax die richtige Wahl ist. Vielen Dank –