In Bezug auf Leistung und Effizienz, ist es besser, viele kleine Dateien zu verwenden (für viele, ich meine so viel wie ein paar Millionen) oder ein paar (zehn oder so) riesige (mehrere Gigabyte) Dateien? Sagen wir einfach, ich baue eine Datenbank (nicht ganz richtig, aber alles, was zählt, ist, dass auf sie viel zugegriffen wird).Viele kleine Dateien oder ein paar große?
Ich bin hauptsächlich mit Leseleistung betroffen. Mein Dateisystem ist derzeit ext3 auf Linux (Ubuntu Server Edition, wenn es darauf ankommt), obwohl ich in einer Position bin, wo ich noch wechseln kann, so dass Vergleiche zwischen verschiedenen Dateisystemen fabelhaft wären. Aus technischen Gründen kann ich dafür kein DBMS verwenden (daher die Frage), daher ist "nur MySQL verwenden" keine gute Antwort.
Vielen Dank im Voraus, und lassen Sie mich wissen, wenn ich genauer sein muss.
EDIT: Ich werde viele relativ kleine Stücke von Daten zu speichern, weshalb viele kleine Dateien mit für mich wäre einfacher. Wenn ich also ein paar große Dateien verwenden würde, würde ich nur einige KB gleichzeitig abrufen. Ich würde auch einen Index verwenden, also ist das nicht wirklich ein Problem. Außerdem zeigen einige der Daten auf andere Datenelemente hin (dies würde auf die Datei im Fall der Particle-of-Small-Files verweisen und auf den Speicherort der Daten innerhalb der Datei im Fall der Großdateien verweisen).
Je unbestimmter die Information ist, desto mehr wirst du bekommen, 'es kommt darauf an' – McAden
Nun, welche anderen Informationen sollte ich hinzufügen? Ich kann mir nichts anderes vorstellen, was der Frage nützen würde. –
Das Zugriffsprofil dieser Daten macht einen großen Unterschied. Werden Sie große Datenmengen lesen? Gibt es einige Daten, auf die am ehesten zugegriffen werden kann? Irgendwann ist es besser für Sie, eine DB statt vieler kleiner Dateien zu verwenden, es sei denn, Sie tun etwas, das EASY ist, wie sie über http zu bedienen, und es muss wirklich schnell sein. – jamuraa