Hier ist ein Beispiel-Datenrahmen:Save Pandas Datenrahmen mit h5py für interoperabilty mit anderen hdf5 Lesern
import pandas as pd
NaN = float('nan')
ID = [1, 2, 3, 4, 5, 6, 7]
A = [NaN, NaN, NaN, 0.1, 0.1, 0.1, 0.1]
B = [0.2, NaN, 0.2, 0.2, 0.2, NaN, NaN]
C = [NaN, 0.5, 0.5, NaN, 0.5, 0.5, NaN]
columns = {'A':A, 'B':B, 'C':C}
df = pd.DataFrame(columns, index=ID)
df.index.name = 'ID'
print(df)
A B C
ID
1 NaN 0.2 NaN
2 NaN NaN 0.5
3 NaN 0.2 0.5
4 0.1 0.2 NaN
5 0.1 0.2 0.5
6 0.1 NaN 0.5
7 0.1 NaN NaN
Ich weiß, dass Pandas die pytables Basis HDFStore hat, die eine einfache Möglichkeit, ein Datum effizient zu serialisiert/deserialisiert Rahmen. Aber diese Datensätze sind nicht sehr einfach direkt mit einem Reader h5py oder Matlab zu laden. Wie kann ich einen Datenrahmen mit h5py speichern, so dass ich ihn einfach mit einem anderen hdf5 reader laden kann?
Ich hatte die Standardargumente des 'festen' Formats verwendet, ohne data_columns zu setzen, das eine viel andere und abstrakter aussehende hdf5 Datei hat, als wenn format = 'table', data_columns = True verwendet wird. Was die Pandas-Dokumentation zur externen Kompatibilität mit HDFStore betrifft, lese ich sie erneut und würde Ihre Antwort nie von dieser Beschreibung aus sehen. Vielen Dank für Ihre klare und sehr hilfreiche Antwort! – Phil
Wenn Sie diesem Doku-Beispiel noch weitere Kommentare hinzufügen möchten, wäre das eine tolle Sache! Bitte senden Sie eine Pull-Anfrage – Jeff
Ich möchte zum Doc-Beispiel hinzufügen, aber ich habe Probleme. Eine Folgefrage finden Sie unter http://StackOverflow.com/questions/30807270. – Phil