2016-08-01 10 views

Antwort

2

In der Datenverarbeitung können wir jeden Datensatz einzeln verarbeiten (ein mit Zeitstempel versehener Datensatz heißt event) oder mit einer Sammlung von Datensätzen umgehen, die einen Batch aufrufen.

Pig führt die Stapelverarbeitung durch, da Eingangsdatensätze nicht nacheinander verarbeitet werden. In der Tat lädt Pig alle verfügbaren Datensätze im Eingabepfad als einen Stapel.

Map Reduce ist ein Datenverarbeitungsrahmen, der für die Stapelverarbeitung entwickelt wurde, mapreduce bedeutet Stapelverarbeitung, Batchverarbeitung ist jedoch nicht mapreduce.

+0

vielen Dank –

+0

Sie sind herzlich willkommen @MrShetty, bitte akzeptieren Sie die Antwort, um hilfreich zu sein. – 54l3d