Probamos que la librería de acceso a archivos HDF5 de Python, `h5py`, funciona correctamente:

In [3]:
import h5py 

In [10]:
# Creamos un archivo en modo escritura
f = h5py.File("test.h5", "w")

In [11]:
# lo cerramos:
f.close()

### Tipos de datos que almacena un HDF5

#### Grupos:
Podemos crear grupos en un archivo, aunque estos se pueden crear automáticamente al momento de guardar un dataset

In [17]:
# Abrimos el archivo anterior en modo lectura y escritura:
f = h5py.File("test.h5", "r+") 

In [19]:
f.create_group("Header")
f.create_group("Data")

<HDF5 group "/Data" (0 members)>

In [21]:
# Para consultar lo que hay en un archivo, usamos .keys()
list(f.keys())

['Data', 'Header']

In [27]:
f.close()

#### Datasets:
Podemos crear datasets vacios (de cierto tamaño y tipo de dato definido), así como "llenos" directamente.

In [24]:
# Cargamos datos del ejemplo de la clase:
import numpy as np

rand1 = np.loadtxt("datos.txt", usecols=[1], unpack=True) 

In [30]:
# Abrimos nuevamente el archivo en modo r+:
f = h5py.File("test.h5", "r+") 

In [32]:
# Almacenamos nuestro array:
f["rand1"] = rand1

In [33]:
f.close()

In [34]:
# También puedo agregar datos dentro de los grupos:
f = h5py.File("test.h5", "r+") 
f["Data/rand2"] = rand1+10.7

In [35]:
f.close()

In [36]:
# Incluso, los grupos nuevos se crean automáticamente al momento de almacenar un dataset:
f = h5py.File("test.h5", "r+") 
f["DataBad/rand3"] = rand1/0.68

In [37]:
f.close()

Para leer los datos, utilizamos la misma estrategia que los objetos compuestos de numpy utilizando el objeto que contiene el archivo HDF5:

In [40]:
f = h5py.File("test.h5", "r")

In [43]:
# utilizando el label y el operador de indexación se puede acceder al contenido del archivo:
f['rand1'][:50]

array([-0.750514,  1.513391, -0.257402,  2.42373 , -0.937215,  0.607678,
       -0.802247, -0.03792 , -1.16919 , -1.32793 , -1.44829 ,  0.434063,
       -0.888893,  1.350377, -0.389023,  0.154864, -1.156754, -1.201204,
       -0.622379,  0.389723,  0.584301,  1.207718,  0.113014, -1.357977,
       -0.048609, -0.230104, -0.647716,  0.394307,  0.467628,  0.684698,
        1.343784,  0.045572,  0.888684,  1.378604,  0.309605, -0.115059,
        0.074366,  1.317366,  2.239764,  0.195176, -1.171153, -1.399296,
       -0.244733,  0.890791, -0.007609, -0.335468,  0.807286,  1.854221,
        0.395264,  0.748414])

In [44]:
# Para trabajar con los datos del HDF5, es conveniente copiar los valores a la memoria RAM:
mi_array= f['rand1'][:]

In [45]:
mi_array

array([-0.750514,  1.513391, -0.257402, ...,  0.629598,  0.037971,
        0.256897])

In [46]:
f.close()