### Riferimenti bibliografici:

* Hastie, T.; Tibshirani, R. & Friedman, J. (2009), [The Elements of Statistical Learning](https://web.stanford.edu/~hastie/ElemStatLearn/).

# Componenti e curve principali

## Indice

1. [Analisi delle componenti principali (PCA)](#pca)<br />
    1.1 [Relazione tra PCA e decomposizione a valori singolari (SVD)](#svd)<br />
    1.2 [Studiare l'effetto della centratura di X](#centratura)<br />
2. [Spirale logaritmica](#spirale)<br />
    2.1 [Generare le osservazioni](#generare)<br />
    2.2 [Visualizzare le osservazioni](#visualizzare)<br />
3. [Curve principali](#curve_principali)<br />

In [None]:
import inspect
import math
import matplotlib.pyplot as plt
import numpy as np

%load_ext autoreload
%autoreload 2

# 1. Analisi delle componenti principali (PCA) <a id=pca> </a>

## 1.1 Relazione tra PCA e decomposizione a valori singolari (SVD) <a id=svd> </a>

In [None]:
np.random.seed(42)

x1 = np.random.uniform(3, 6, size=100)
x2 = 10 - x1 + np.random.normal(scale=0.5, size=100)
X = np.c_[x1, x2]

$\mathbf{X}$ è una matrice $N\times p$.

$\mathbf{X} = \mathbf{U}\mathbf{D}\mathbf{V}^\top$ è detta *decomposizione a valori singolari* (SVD).

$\mathbf{U}$ è una matrice $N\times p$ ortogonale le cui colonne vengono chiamate *vettori singolari sinistri*.

$\mathbf{V}$ è una matrice $p\times p$ ortogonale le cui colonne vengono chiamate *vettori singolari destri*.

$\mathbf{D}$ è una matrice $p\times p$ diagonale i cui valori vengono chiamati *valori singolari* e corrispondono alla radice quadrata degli autovalori di $\mathbf{X}^\top\mathbf{X}$.

$\mathbf{U}\mathbf{D}$ vengono dette le *componenti principali* di $\mathbf{X}$.

$\mathbf{V}_q$ è la matrice composta dalle prime $q$ colonne di $\mathbf{V}$.

$\mathbf{H}_q = \mathbf{V}_q\mathbf{V}_q^\top$ è una *matrice di proiezione*, mappa ogni riga di $X$ (vista come vettore colonna), $x_i$, nella sua ricostruzione di ordine $q$, $\mathbf{H}_qx_i$ (quindi $\mathbf{X}_q = \mathbf{X}\mathbf{H}_q$).

In [None]:
np.random.seed(42)

x = np.linspace(3, 6, num=100)
X = np.c_[x, 10 - x] + np.random.multivariate_normal(np.zeros(2), 0.1 * np.eye(2), size=len(x))
print("Dimensioni di X (N X p): {} X {}".format(*X.shape))

### Esercizio

1. Ottenere $\mathbf{U}$, $\mathbf{D}$, $\mathbf{V^\top}$ utilizzando la funzione [`numpy.linalg.svd()`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.linalg.svd.html) ponendo `full_matrices=False` (nota: la funzione restituisce $\mathbf{U}$, $s$, $\mathbf{V^\top}$, dove $s$ sono gli elementi sulla diagonale di $D$);
2. Verificare che $\mathbf{X} = \mathbf{U}\mathbf{D}\mathbf{V}^\top$ utilizzando la funzione [`numpy.allclose()`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.allclose.html);
3. Verificare che `U.dot(D)`è equivalente a `U * s`;
4. Dire grazie a che proprietà in NumPy è possibile moltiplicare (prodotto di Hadamard) un array $(N, K)$ con un array $(K,)$.

## 1.2 Studiare l'effetto della centratura di X <a id=centratura> </a>

> Nota: questa parte è ispirata a una [domanda](https://stats.stackexchange.com/questions/22329/how-does-centering-the-data-get-rid-of-the-intercept-in-regression-and-pca/22331#22331) chiesta su [Cross Validated](https://stats.stackexchange.com/) ([StackExchange](https://stackexchange.com/))

In [None]:
from msbd.grafici import grafico_proiezione_sul_primo_asse_principale

print(inspect.getsource(grafico_proiezione_sul_primo_asse_principale))

In [None]:
plt.figure(figsize=(6, 6))

grafico_proiezione_sul_primo_asse_principale(X)

plt.show()

### Esercizio

Riottenere il grafico sui dati centrati.

# 2. Spirale logaritmica <a id=spirale> </a>

### Rappresentazione parametrica della spirale logaritmica

$
\begin{align}
x(\lambda)&=a{\text{e}}^{b\lambda}\cos(\lambda)\\
y(\lambda)&=a{\text{e}}^{b\lambda}\sin(\lambda)
\end{align}
$

In [None]:
from msbd.datasets import SpiraleLogaritmica

print(inspect.getsource(SpiraleLogaritmica))

## 2.1 Generare le osservazioni <a id=generare> </a>

In [None]:
sl = SpiraleLogaritmica(0.5, 0.5)

l = np.random.uniform(-math.pi / 4, math.pi, 100)
l.sort()
X = sl.f(l)
X_oss = X + np.random.multivariate_normal(np.zeros(2), 0.01 * np.eye(2), size=len(X))
X -= X_oss.mean(axis=0)
X_oss -= X_oss.mean(axis=0)

## 2.2 Visualizzare le osservazioni <a id=visualizzare> </a>

In [None]:
plt.figure(figsize=(8, 5))

plt.plot(X[:, 0], X[:, 1], lw=2, label="Spirale logaritmica")
plt.scatter(X_oss[:, 0], X_oss[:, 1], facecolor="none", edgecolor="tab:blue", label="Osservazioni")
plt.xlim([-2.5, 1.5])
plt.ylim([-1.5, 1])
plt.axis("off")
plt.tight_layout()
plt.legend()

plt.show()

# 3. Curve principali <a id=curve_principali> </a>

Passaggi per ottenere la curva principale $f(\lambda)$ (da [The Elements of 
Statistical Learning](https://web.stanford.edu/~hastie/ElemStatLearn/) paragrafo 14.5.2):

$f(\lambda) = [f_1(\lambda),\, f_2(\lambda),\, \cdots,\, f_p(\lambda)]$.

$X^\top = [X_1,\, X_2,\, \cdots,\, X_p]$ vettore casuale.

$\hat{\lambda}_f(x)$ definisce il punto sulla curva più vicino a $x$.

$\hat{f}(\lambda)\leftarrow E(X\mid\lambda_f(X) = \lambda)$ è chiamata *curva principale* per la distribuzione del vettore casuale $X$.

Passaggi da alternare fino a convergenza:

1. $\hat{f}_j(\lambda)\leftarrow E(X_j\mid\lambda(X) = \lambda);\; j=1, 2, \cdots,p,$
2. $\hat{\lambda}_f(x)\leftarrow \mathrm{argmin}_{\lambda^\prime}\Vert x - \hat{f}(\lambda^\prime)\Vert$.

In [None]:
from msbd.varieta import CurvaPrincipale

print(inspect.getsource(CurvaPrincipale))

In [None]:
from msbd.grafici import grafico_curva_principale

print(inspect.getsource(grafico_curva_principale))

In [None]:
cp = CurvaPrincipale()
it = 0

while True:
    it += 1

    cp.partial_fit(X_oss)
    
    plt.figure(figsize=(8, 5))
    
    plt.title("Curva principale dopo {} iterazioni".format(it))
    plt.plot(X[:, 0], X[:, 1], lw=2, label="Spirale logaritmica")
    grafico_curva_principale(X_oss, cp)
    plt.xlim([-2.5, 1.5])
    plt.ylim([-1.5, 1])
    plt.axis("off")
    plt.tight_layout()
    plt.legend()

    plt.show()
    
    i = input("Premere invio per continuare, q (quit) per uscire:")

    if i == "q":
        break

### Esercizio

1. Definire una nuova classe con la stessa struttura di `SpiraleLogaritmica`;
2. Ripetere tutti i passaggi visti nel notebook.