Wenn Dateien über den verteilten Cache-Mechanismus in einem Hadoop-Streaming-Job an Knoten übertragen werden, löscht das System diese Dateien, nachdem ein Job abgeschlossen wurde? Wenn sie gelöscht werden, was ich vermute, gibt es eine Möglichkeit, den Cache für mehrere Jobs zu behalten? Funktioniert das auf Amazon Elastic Mapreduce?Lebensdauer des verteilten Caches in Hadoop
6
A
Antwort
5
Ich habe im Quellcode herumgegraben, und es sieht so aus, als ob Dateien von TrackerDistributedCacheManager
etwa einmal pro Minute gelöscht werden, wenn ihre Referenzzahl auf Null fällt. Die TaskRunner
gibt explizit alle ihre Dateien am Ende einer Aufgabe frei. Vielleicht solltest du TaskRunner
bearbeiten, um dies nicht zu tun, und den Cache durch explizitere Mittel selbst steuern?
2
I cross posted this question at the AWS forum und bekam eine gute Empfehlung, hadoop fs -get
zu verwenden, um Dateien auf eine Weise zu übertragen, die über Jobs hinweg besteht.
Verwandte Themen
- 1. Hadoop-Shutdown, wie Hadoop im pseudo-verteilten Modus zu stoppen?
- 2. Zugriff auf Dateien im verteilten hadoop-Cache
- 3. Warmstart des Caches
- 4. Lebensdauer des Ausnahmeobjekts
- 5. Lebensdauer des WCF-Service-Verhaltens
- 6. Schauspieler die Lebensdauer des Systems in WPF
- 7. Löschen des Caches auf AWS Redshift
- 8. Curl-Befehl ohne Verwendung des Caches
- 9. Merging Eingänge in verteilten Anwendung
- 10. Mehrere Caches in Memcached
- 11. Statische Caches in Webdiensten
- 12. Lebensdauer des Controllers im Frühling MVC
- 13. Entscheidung in verteilten Anwendungen
- 14. Caches "neu laden" in TYPO3?
- 15. ImageSource Binding Caches Image
- 16. Speichern und Abrufen des JCS-Caches aus einer Datei
- 17. Wie wird der Speicherort des Gradle-Caches eingestellt?
- 18. Löschen des Caches aus der Rails-Asset-Pipeline
- 19. Schlüsselwortgesteuerte Testautomatisierung in verteilten Systemen
- 20. apache2 Caches css
- 21. facebook caches og: titel?
- 22. Aktualisieren eines LRU-Caches
- 23. Problem beim Einstellen des Caches als Datentabelle und Lesen
- 24. Intellij Idea12 Fehler beim Löschen des URL-Caches
- 25. SharePoint Caches falsche Anmeldeinformationen
- 26. Realm-Datei in Caches-Verzeichnis kopieren
- 27. Hadoop-Konfiguration Physischer Standort
- 28. memcached Caches Anfrage?
- 29. Moq Caches Rückgabewert
- 30. Lebensdauer von C++ - Klassenmitgliedern
Das ist eine große Hilfe. Ich denke, es könnte andere Wege geben, Dateien auf die Knoten zu laden, die ich untersuchen werde. Der verteilte Cache war genau die Methode, mit der ich vertraut war. Danke für den Code Ref, das ist unglaublich hilfreich. –