Ich lese das Buch Python und HDF5 (O'Reilly), die einen Abschnitt über die leeren Datensätze hat und die Größe, die sie auf der Festplatte nehmen:Größe auf der Festplatte eines teilweise gefüllten HDF5 Dataset
import numpy as np
import h5py
f = h5py.File("testfile.hdf5")
dset = f.create_dataset("big dataset", (1024**3,), dtype=np.float32)
f.flush()
# Size on disk is 1KB
dset[0:1024] = np.arange(1024)
f.flush()
# Size on disk is 4GB
Nach dem Ausfüllen des ersten Datensatzes (1024 Einträge) mit den Werten erwartete ich, dass die Datei wachsen würde, aber nicht auf 4 GB. Es ist im Wesentlichen die gleiche Größe wie wenn ich es tue:
dset[...] = np.arange(1024**3)
Das Buch besagt, dass die Dateigröße auf der Festplatte sollte um 66KB sein. Könnte jemand erklären, was der Grund für die plötzliche Größenzunahme ist?
Version Info:
- Python 3.6.1 (OSX)
- h5py 2.7.0