Wir möchten Amazon Elastic MapReduce auf unserer aktuellen Datenbank verwenden (wir verwenden Cassandra auf EC2). Mit Blick auf die Amazon EMR FAQ, sollte es möglich sein: Amazon EMR FAQ: Q: Can I load my data from the internet or somewhere other than Amazon S3?Konfigurieren der externen Datenquelle für Elastic MapReduce
Allerdings, wenn Sie einen neuen Job-Flow erstellen, können wir nur einen S3-Bucket als Eingabedatenursprung konfigurieren.
Irgendwelche Ideen/Beispiele auf, wie dies zu tun?
Danke!
S.S .: Ich habe diese Frage How to use external data with Elastic MapReduce gesehen, aber die Antworten erklären nicht wirklich, wie man es macht/konfiguriert, einfach, dass es möglich ist.