Ich weiß, Cassandra ist immer noch extrem in der Beta, aber ich würde gerne damit spielen. Dies ist in keiner Weise ein Produktionsprojekt; es ist nur zum Spaß und um ein bisschen zu lernen. Aber der beste Weg zu lernen ist, tatsächlich zu implementieren und Leute dazu zu bringen, es auf Herz und Nieren zu prüfen.Cassandra auf EC2 bereitstellen?
Ich möchte Cassandra mit Heroku verwenden, so möchte ich es auf EC2 einsetzen (wie Heroku ist). Was ist der beste, einfachste, billigste Weg? Irgendwelche Empfehlungen?
Ich habe ein paar durch Google gesehen, aber sie warnen Dinge wie: Die EC2-Instanzen für den produktiven Einsatz geeignet sind. Sie speichern die Daten in der Instanz selbst und verschwinden, wenn die Instanz heruntergefahren wird.
Diese Antwort ist wirklich veraltet. Erstens benutzt niemand EBS mit Cassandra. Im Ernst, tu es nicht. Erstellen Sie stattdessen ein LVM RAID-0-Volume aller ephemeren Datenträger mit ext4. Verwenden Sie m1.xlarge, da es vier Ephemerals und E/A-Bandbreite ist der größte Engpass auf EC2. Stellen Sie sicher, dass Sie Ihre Knoten über Verfügbarkeitszonen hinweg stripen, damit Sie einen Netzsplit/vollständigen AZ-Ausfall überleben können. Schreiben Sie einen Cron-Job, um reguläre nodetool-Snapshots auszuführen und laden Sie ihn zur Sicherung in S3 hoch. Da die I/O-Bandbreite Ihr schlimmster Feind ist, ist es wahrscheinlicher, dass Sie Ihren Cluster vergrößern, als einmal in der Produktion die Instanzgröße zu erhöhen. –