Meine Frage ist, dass ich eine Textdatei mit 100 Wörtern durch Leerzeichen getrennt habe und ich muss ein Wort zählen Programm zu tun.Hadoop Mapreduce HDFS Blocksplit
Also, wenn mein Name Knoten die Datei in HDFS-Blöcke teilt, wie können wir sicher sein, dass die Aufspaltung nur am Ende des Wortes erfolgt?
Dh, wenn ich mein 50. Wort in der Textdatei als Hadoop habe, was wäre, wenn es in 64MB Blöcke aufteilt, könnte der Speicher des aktuellen Blocks 64MB in der Mitte des Wortes Hadoop erreichen und somit enthält ein Block ' hatte 'und der andere' oop 'in einem anderen Block.
Sorry, wenn die Frage albern klingen mag, aber bitte geben Sie die Antwort. Danke.