# El corpus Olivetti

Olivetti contiene $N=400$ imágenes de caras de $C=40$ personas, con 10 imágenes por persona. Las imágenes se adquirieron en momentos diferentes, variando la iluminación, expresión facial (cerrando o no los ojos; sonriendo o no) y detalles faciales (con o sin gafas). Todas ellas se hallan normalizadas a $64\times 64$ píxeles en escala de gris entre $0$ y $1$, esto es cada imagen puede verse como una vector de $D=4096$ dimensiones de características reales en $[0, 1]$. Las personas se halla identificadas mediante una etiqueta entera de $0$ a $39$.

In [1]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_olivetti_faces

In [None]:
orl = fetch_olivetti_faces()
print(orl.DESCR)

Veamos la primera imagen de cada persona:

In [None]:
nrows, ncols = 4, 10
fig, axes = plt.subplots(nrows=nrows, ncols=ncols, figsize=(18, 18*nrows/ncols), constrained_layout=True)
for c in np.arange(0, 40):
    ax = axes.flat[c]
    ax.set_axis_off()
    ax.imshow(orl.images[10*c], cmap=plt.cm.gray, interpolation="none")
    ax.set_title("Persona {:}".format(c))

Veamos las $10$ imágenes de algunas personas:

In [None]:
cc = [0, 9, 21, 36]
nrows, ncols = len(cc), 10
fig, axes = plt.subplots(nrows=nrows, ncols=ncols, figsize=(18, 18*nrows/ncols), constrained_layout=True)
for i, c in enumerate(cc):
    for j in np.arange(0, 10):
        ax = axes.flat[10*i+j]
        ax.set_axis_off()
        ax.imshow(orl.images[10*c+j], cmap=plt.cm.gray, interpolation="none")
        ax.set_title("Pers. {:} cara {:}".format(c, i))