# Exerciții Algebră Liniară și Tehnici de Optimizare

Acest Jupyter Notebook conține o serie de exerciții introductive care vă vor ajuta să vă consolidați cunoștințele de algebră liniară, NumPy și optimizare.

In [None]:
import numpy as np

## I. Algebră Liniară

### Produsul scalar

Implementați funcția `dot_product`, care să conțină explicit o buclă `for`, prin care calculați produsul scalar a doi vectori,
$$
    v \cdot w = \sum_{i \, = \, 1}^{n} v_i w_i
$$
unde $v, w \in \mathbb{R}^n$.

In [None]:
def dot_product(v, w):
    ...

In [None]:
# Verificare
assert dot_product([1, 2, 3], [2, 0, -1]) == -1
assert dot_product([4, 2, 5], [2, 1, -2]) == 0

### Produsul scalar indus de o matrice simetrică și pozitiv definită

Fiind dată o matrice $P \in M_n (\mathbb{R})$, definim o aplicație bilinară pe $\mathbb{R}^n$ prin
$$
    (v, w)_{P} = w^{\intercal} P v
$$

Se poate arăta că, dacă $P$ este simetrică ($A^{\intercal} = A$) și pozitiv definită (toate valorile ei proprii sunt strict pozitive), atunci forma $(\cdot, \cdot)_{P}$ este un produs scalar.

Implementați o funcție care să calculeze valoarea lui $(v, w)_{P}$. Puteți folosi metode/operatori din NumPy.

In [None]:
def P_dot_product(v, w, P):
    ...

### Spațiul nul

Fiind dată o matrice pătratică $A \in M_n (\mathbb{R})$, găsiți o cale de a determina spațiul nul (nucleul) acesteia,
$$
    \ker(A) = \{ \, x \in \mathbb{R}^n \; | \; Ax = 0_{n} \, \}
$$

In [None]:
A = np.array([
    [1, 2, 3],
    [4, 0, 1],
    [0, 0, 0],
])

# ker A = ?

### Exponențiala matricială

Funcția exponențială este definită pentru valori reale prin șirul
$$
    e^x = \sum_{k \, = \, 0}^{\infty} \frac{1}{k!} x^k
$$

În mod similar, exponențiala pentru matrici pătratice se poate defini prin
$$
    e^A = \sum_{k \, = \, 0}^{\infty} \frac{1}{k!} A^k
$$
unde $A^0 = \text{I}_n$.

Implementați o funcție care să calculeze valoarea aproximativă a exponențialei matriceale, folosind un număr fixat de termeni ai șirului de mai sus.

In [None]:
def matrix_exp(A, N):
    ...

### Formula lui Jacobi

Din [formula lui Jacobi](https://en.wikipedia.org/wiki/Jacobi%27s_formula) rezultă că
$$
    \det\left(e^A\right) = e^{\operatorname{tr}(A)}
$$
Verificați validitatea acestui rezultat pentru matricea de mai jos.

In [None]:
A = np.array([
    [1, 0, 3],
    [4, 2, 1],
    [3, 0, 4],
])

...

## II. Tehnici de Optimizare

### Metoda lui Newton

Pentru funcții care sunt cel puțin de două ori derivabile, și pentru care derivata a doua nu se anulează, putem folosi [metoda lui Newton](https://en.wikipedia.org/wiki/Newton%27s_method_in_optimization) pentru a le găsi minimele (locale).

Pasul iterativ de optimizare este:
$$
    x_{k + 1} = x_{k} - \frac{f'\left(x_{k}\right)}{f''\left(x_{k}\right)}
$$
unde $x_{k}$ reprezintă estimarea de la pasul precedent, $x_{k + 1}$ este noua estimare pentru minimul funcției, iar $f'$ și $f''$ reprezintă derivata și derivata a doua funcției $f$.

Calculați și completați mai jos formulele pentru prima și a doua derivată a [funcției date](https://www.desmos.com/calculator/mifhxioowk), apoi implementați metoda Newton și folosiți-o pentru a găsi minimul funcției.

**Bonus**: afișați grafic funcția și evoluția algoritmului folosind [matplotlib](https://matplotlib.org/).

In [None]:
def f(x):
    return x^5 - 3 * x^3 + x^2 + 0.5 * x - 1

In [None]:
def f_first_derivative(x):
    ...

def f_second_derivative(x):
    ...

In [None]:
def newtons_method(x0, max_steps):
    ...

### $p$-norme

Implementați o funcție care calculează distanța dintre doi vectori în [norma $p$](<https://en.wikipedia.org/wiki/Norm_(mathematics)#p-norm>),
$$
    d_p (v, w) = \left[\sum_{i \, = \, 1}^{n} (v_i - w_i)^{p}\right]^{1/p}
$$

In [None]:
def p_distance(v, w):
    ...

### Centrul de greutate

Pentru o mulțime de puncte $P$, definim _centrul de greutate_ sau _centroidul_ mulțimii prin
$$
    \mu = \frac{1}{|P|} \sum_{x \, \in \, P} x
$$

Altfel spus, fiecare coordonată a centrului de greutate este dată de media aritmetică a valorilor acelei coordonate, la nivelul tuturor punctelor din mulțime.

Implementați o funcție care să calculeze centroidul unei mulțimi de puncte, date sub formă de listă de vectori (toți având aceeași dimensiune / același număr de coordonate).

In [None]:
def centroid(vectors):
    ...

### Inerția

O abordare uzuală în învățarea nesupervizată este clusterizarea datelor de intrare, pentru a le grupa în mulțimi de puncte „apropiate”.

Un mod de a măsura cât de apropiate sunt punctele din fiecare cluster este de a calcula _inerția_ clusterizării,
$$
    \text{Inertia} = \sum_{i \, = \, 1}^{N} \sum_{x \, \in \, C_i} \left[d_2 (x, \mu_i)\right]^2
$$
unde $C_i$ reprezintă al celui de al $i$-ulea cluster (din totalul de $N$ clustere) iar $\mu_i$ reprezintă _centrul de greutate_ al clusterului $i$,
$$
    \mu_i = \frac{1}{\left|C_i\right|} \sum_{x \, \in \, C_i} x
$$

Implementați o funcție care calculează inerția unei mulțimi de clustere, dată sub forma unei liste de liste de vectori (toți vectorii au aceeași dimensiune, dar clusterele pot avea lungimi diferite).

In [None]:
def compute_inertia(clusters):
    ...