Ich muss gleichzeitig eine große Anzahl von Dateien (Tausende von verschiedenen Dateien mit einer durchschnittlichen Größe von 2 MB pro Datei) verarbeiten.Mehrere Maschinen - mehrere Dateien gleichzeitig verarbeiten?
Alle Informationen werden auf einer (1,5 TB) Netzwerkfestplatte gespeichert und von ungefähr 30 verschiedenen Maschinen abgerufen (gelesen). Aus Effizienzgründen wird jede Maschine verschiedene Dateien lesen (und verarbeiten) (es gibt Tausende von Dateien, die verarbeitet werden müssen).
Jede Maschine - nach dem Lesen einer Datei aus dem Ordner "incoming" auf der 1,5 TB Festplatte - wird die Informationen verarbeiten und bereit sein, die verarbeiteten Informationen zurück in den 'verarbeiteten' Ordner auf der 1,5 TB Laufwerk. Die verarbeiteten Informationen für jede Datei haben ungefähr die gleiche durchschnittliche Größe wie die Eingabedateien (ungefähr ~ 2 MB pro Datei).
Gibt es "do" und "donts" wenn man eine solche Operation baut? ist es ein Problem, wenn 30 Maschinen gleichzeitig Informationen auf demselben Netzlaufwerk lesen (oder schreiben)? (Hinweis: vorhandene Dateien werden nur gelesen, nicht angehängt/geschrieben; neue Dateien werden von Grund auf neu erstellt, so dass es keinen Problem mit Mehrfachzugriff auf die gleiche Datei gibt ...). Gibt es Engpässe, die ich erwarten sollte?
(ich bin benutze Linux, Ubuntu 10.04 LTS auf allen Maschinen, wenn es alle Angelegenheiten)
Es hängt wirklich davon ab, wie viel Verarbeitung Sie für jede Datei tun - zu wenig und Festplattenzugriff ist Ihr Engpass. –