Schnellster Weg, um ein gesamtes HDF5 mit Numpy-Arrays in den Speicher zu laden

Question

Schnellster Weg, um ein gesamtes HDF5 mit Numpy-Arrays in den Speicher zu laden

Gefragt el 13 de Marsch, 2014: Wann wurde die Frage gestellt
4158 Ansichten: Anzahl der Besuche der Frage
1 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich benutze :

import h5py

f = h5py.File('myfile.h5', 'r')
d = {}
for k in f.iterkeys():
    d[k] = f[k][:]

um die gesamte HDF5-Datei (2 GB, 1000 numpy-Arrays von jeweils 2 MB) in den Speicher zu laden.

Gibt es eine schnellere Möglichkeit, den gesamten Inhalt der HDF5-Datei in den Speicher zu laden?

(Vielleicht macht die Schleife hier viele "Bewegungen" (seek?) in der Datei, weil jedes f[k] nicht in der Reihenfolge platziert ist, die for k in f.iterkeys() ergibt?)

Gefragt el 13 de Marsch, 2014 von Basj

Answer 1

1 Antworten

Answer 2

8voto

Joe Punkte 6157

PyTables (eine weitere Python HDF5-Bibliothek) unterstützt das Laden der gesamten Datei in den Speicher unter Verwendung des H5FD_CORE-Treibers. Auch h5py scheint den Zugriff auf dateiüberlagerten Speicher zu unterstützen (siehe Datei-Treiber). Also einfach

import h5py
f = h5py.File('myfile.h5', 'r', driver='core')

und du bist fertig, da die Datei dann bereits im Speicher vorhanden ist.

Beantwortet el 13 de Marsch, 2014 von Joe (6157 Punkte )

Schnellster Weg, um ein gesamtes HDF5 mit Numpy-Arrays in den Speicher zu laden

Antwort

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Schnellster Weg, um ein gesamtes HDF5 mit Numpy-Arrays in den Speicher zu laden

Antwort

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: