Ich bin neu dazu, und meine Anforderung lautet wie folgt:
Ich möchte riesigen Dataset mit Film Bewertungen (im Textformat) verarbeiten und sie in einigen speichern NoSQL-Datenbank, dann einige Verarbeitung und empfehlen Filme für einen bestimmten Film.Java + Hadoop + NoSql (welche Kombinationen zu verwenden)
Also brauche ich Geschwindigkeit - ich denke, Hadoop würde mir dabei helfen, und Daten in NoSQL-Datenbank zu halten, würde weiter in Geschwindigkeit helfen. Ich würde gerne wissen, ob ein anderer Ansatz gut bekannt ist und welche Kombinationen verwendet werden, mit Java
Danke
Wie groß ist der Datensatz? Terrabyte, Petabyte? und wie sieht Ihr Datensatz aus - Textdateien, XML, Binärformat? –
Zu diesem Zeitpunkt sind die Daten in Gigabyte und es steht alles im Text – daydreamer