Angenommen, ich eine einfache Textdatei mit den folgenden Daten haben:Wie wird eine Textmenge als Ganzes einem Knoten zugeordnet?
DataSetOne <br />
content <br />
content <br />
content <br />
DataSetTwo <br />
content <br />
content <br />
content <br />
content <br />
... und so weiter ...
Was ich will ist zu: zählen, wie viele Inhalte in jedem Datensatz. Zum Beispiel sollte das Ergebnis
<DataSetOne, 3>, <DataSetTwo, 4>
Ich bin sein ein beginer Hadoop, frage ich mich, ob es einen Weg gibt, einen Teil der Daten als Ganzes zu einem Knoten abzubilden. B. alle DataSetOne auf Knoten 1 und alle DataSetTwo auf Knoten 2 setzen.
Kann mir jemand eine Idee geben, wie man das archiviert?