Ich möchte den verteilten Cache verwenden, damit meine Mapper auf Daten zugreifen können. Im Haupt verwende ich den BefehlZugriff auf Dateien im verteilten hadoop-Cache
DistributedCache.addCacheFile(new URI("/user/peter/cacheFile/testCache1"), conf);
Wo/user/Peter/cachefile/testCache1 eine Datei, die
dann in hdfs existiert, meine Setup-Funktion wie folgt aussieht:
public void setup(Context context) throws IOException, InterruptedException{
Configuration conf = context.getConfiguration();
Path[] localFiles = DistributedCache.getLocalCacheFiles(conf);
//etc
}
Dieses LocalFiles-Array ist jedoch immer Null.
Ich lief zunächst auf einem Single-Host-Cluster zum Testen, aber ich lese, dass dies verhindert, dass der verteilte Cache funktioniert. Ich habe versucht, mit einem pseudo-verteilt, aber das ist nicht so oder
I hadoop 1.0.3
dank Peter
möglich Duplikat siehe [Dateien nicht korrekt in verteilten Cache setzen] (http://stackoverflow.com/questions/12708947/ files-not-put-correct-in-verteilte-cache) – kabuko