In [None]:
from sklearn.datasets import fetch_olivetti_faces
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from matplotlib import cm

In [None]:
from numpy.random import RandomState

def plot_gallery(title, images, n_col=3, n_row=2, cmap=plt.cm.gray, img_shape=(64,64)):
    plt.figure(figsize=(2. * n_col, 2.26 * n_row))
    plt.suptitle(title, size=16)
    for i, comp in enumerate(images):
        plt.subplot(n_row, n_col, i + 1)
        vmax = max(comp.max(), -comp.min())
        plt.imshow(comp.reshape(img_shape), cmap=cmap,
                   interpolation='nearest',
                   vmin=-vmax, vmax=vmax)
        plt.xticks(())
        plt.yticks(())
    plt.subplots_adjust(0.01, 0.05, 0.99, 0.93, 0.04, 0.)
    
faces, _ = fetch_olivetti_faces(return_X_y=True, shuffle=True,
                                random_state=RandomState(0))


In [None]:
from sklearn.decomposition import PCA

faces, _ = fetch_olivetti_faces(return_X_y=True, shuffle=True)
pca = PCA().fit(faces)
plt.plot(range(1, len(pca.explained_variance_ratio_)+1), np.cumsum(pca.explained_variance_ratio_))
plt.xlabel('number of components')
plt.ylabel('cumulative explained variance')
plt.title("PCA explained variance")
plt.axhline(y=0.90, color="y")
plt.axvline(x=70, color="r")
plt.show()

Zastosuję PCA dla 70 komponentów, ponieważ osiągnę wówczas około 90% wyjaśnialnej wariancji.

In [None]:
pca = PCA(n_components=70)
faces_pca = pca.fit_transform(faces)

print(f"Stopień konwersji: {faces[0].size / faces_pca[0].size}")
IT = pca.inverse_transform(faces_pca)

In [None]:
plot_gallery("Random Olivetti faces", faces[:10], n_col = 5, n_row=2)
plot_gallery("Random Olivetti faces after PCA and Inverse Transformation", IT[:10], n_col = 5, n_row=2)

In [None]:
from sklearn.metrics import mean_squared_error

def RMSE(mod):
    rmse = [0] * 400
    for i, j, k in zip(faces, mod, range(400)):
        rmse[k] = mean_squared_error(i, j, squared=False)

    print(f"Uśredniony błąd RMSE: {np.mean(rmse)}")

RMSE(IT)

In [None]:
# zamiana koloru
faces_minus = - faces

plot_gallery("Random Olivetti faces", faces_minus[:10], n_col = 5, n_row=2)
RMSE(faces_minus)

In [None]:
# Odwrocone do gory nogami
faces_flip = []

for i in faces: faces_flip.append(i[::-1])
plot_gallery("Random Olivetti faces", faces_flip[:10], n_col = 5, n_row=2)
RMSE(faces_flip)

In [None]:
# Zwiekszony kontrast
faces_mul = 10 * faces

plot_gallery("Random Olivetti faces", faces_mul[:10], n_col = 5, n_row=2)
RMSE(faces_mul)

In [None]:
# Przyciemnienie
faces_dark = faces - 2

plot_gallery("Random Olivetti faces", faces_dark[:10], n_col = 5, n_row=2)
RMSE(faces_dark)

In [None]:
# Rozjasnianie
faces_light = faces + 2

plot_gallery("Random Olivetti faces", faces_light[:10], n_col = 5, n_row=2)
RMSE(faces_light)

Wnioski:
Najmniejszy błąd RMSE osiągnęły zdjęcia po transformacji odwrotnej. Mimo znaczącego stopnia kompresji, nie były one dużo bardziej rozmazane. Osoby na tych zdjęciach miały obwódki wokół oczu, jakby okulary.