# Tutorial h5py

Siguiendo las instrucciones dadas en: https://docs.h5py.org/en/latest/quick.html

## Core concepts

Primero creamos los datos con los que trabajar:

In [34]:
import h5py
import numpy as np
f = h5py.File("mytestfile.hdf5", "w")
dset = f.create_dataset("mydataset", (100,), dtype='i')


In [35]:
f.close()

O también serviría:

In [36]:
with h5py.File("mytestfile.hdf5", "w") as f:
    dset = f.create_dataset("mydataset", (100,), dtype='i')

f.close()

Comenzamos con el tutorial, abriendo el archivo h5py:


In [38]:
f = h5py.File('mytestfile.hdf5', 'r')

`h5py.File` actúa como un diccionario:

In [39]:
list(f.keys())

['mydataset']

Miramos qué hay dentro del único dataset, que se comporta como un array de NumPy:

In [40]:
dset = f['mydataset']

In [41]:
dset.shape

(100,)

In [42]:
dset.dtype

dtype('int32')

Comparten todas las propiedades de un array: slicing, indexing...

In [30]:
# Para poder escribir en el dataset tenemos que abrirlo con 'w'
f.close()
with h5py.File("mytestfile.hdf5", "w") as f:
    dset = f.create_dataset("mydataset", (100,), dtype='i')

In [31]:
dset[...] = np.arange(100)
print(dset[10])
print(dset[0:100:10]) #de 0 a 100 by 10

ValueError: Not a dataset (not a dataset)

## Jerarquía

In [43]:
dset.name

'/mydataset'

In [44]:
f.name

'/'

El archivo se encuentra en el root

Creamos un subgrupo:

In [46]:
f = h5py.File('mydataset.hdf5', 'a')
grp = f.create_group("subgroup")

ValueError: Unable to create group (name already exists)

In [47]:
#Creamos el dataset dentro del subgrupo
dset2 = grp.create_dataset("another_dataset", (50,), dtype='f')
dset2.name

'/subgroup/another_dataset'

Si queremos acceder:


In [48]:
f['subgroup/another_dataset']

<HDF5 dataset "another_dataset": shape (50,), type "<f4">

Si hacemos un bucle en el fichero nos saca todos los subgrupos que hay

In [49]:
for name in f:
    print(name)

subgroup
