<a href="https://colab.research.google.com/github/erodola/NumMeth-s2-2023/blob/main/esercizi/ex1/ex1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Metodi numerici per l'informatica - Esercitazione 1

Benvenuti al corso di *Metodi Numerici dell'Informatica*. L'obiettivo delle esercitazioni è quello di impadronirsi dei concetti spiegati nelle lezioni teoriche da un punto di vista pratico. In particolare, useremo il linguaggio *Python 3.8* e la libreria per il calcolo numerico *NumPy*. Le Esercitazioni sono strutturate come Jupyter notebooks in Colab dove vengono presentati richiami alla teoria, esempi eseguibili ed esercizi guidati. Ricordiamo di eseguire i notebooks in ordine sequenziale. Eseguire il notebook in ordine diverso da quello sequenziale puo' portare a risultati non aspettati dato che usiamo variabili aventi lo stesso nome in celle diverse. **Let's have fun!**

Gli argomenti dell'Esercitazione 1 sono i seguenti:

1. *Vettori*
2. *Matrici*

Prima di iniziare, come primo step, dobbiamo importare le dipendenze necessarie per eseguire il notebook. Tale operazione sarà eseguita all'inizio di tutti i notebooks futuri. Le due librerie che useremo principalmente sono NumPy, per eseguire calcoli numerici e *Matplotlib* per visualizzare i risultati. Inoltre importiamo il modulo locale `utils.py` per caricare alcune funzionionalità aggiuntive.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

%matplotlib inline

Quando eseguiamo il notebook su Colab bisogna scaricare diversi file locali dalla repository git, che useremo in seguito:

In [None]:
!wget https://raw.githubusercontent.com/erodola/NumMeth-s2-2023/main/esercizi/ex1/bitcoin.txt
!wget https://github.com/erodola/NumMeth-s2-2023/raw/main/esercizi/ex1/drums.wav
!wget https://github.com/erodola/NumMeth-s2-2023/raw/main/esercizi/ex1/bass.wav

In [None]:
ls

## 1. Vettori

### 1.a Creazione di vettori

Il datatype fondamentale che NumPy adopera è il `numpy.ndarray`, chiamato anche semplicemente *array* NumPy. Con questa struttura dati possiamo rappresentare un'ampia classe di oggetti algebrici quali vettori, matrici e tensori multidimensionali. Iniziamo con l'oggetto numerico elementare, ossia il vettore.

Un vettore (reale) $n$-dimensionale $\mathbf{x}$  è una sequenza (finita e ordinata) di $n$ numeri reali $x_i \in \mathbb{R}$:
$$\mathbf{x} = (x_1, \dots, x_n)  \in \mathbb{R}^n$$

In Python possiamo rappresentare un vettore semplicemente con il datatype `list`:

In [None]:
x = [0., 3.5, 4.]

print(f"x = {x}")
print(f"type(x) = {type(x)}")

Il problema di questa rappresentazione e' l'assenza di un numero cospicuo di operazioni che possono essere effettuate con i vettori numerici. Per esempio se proviamo a creare un un altro vettore $\mathbf{y}$ come lista di numeri e applichiamo l'operatore `+` di Python, otteniamo la concatenazione delle liste invece del vettore $(-1, 3.5, 6)$:

In [None]:
y = [-1., 0., 2.]
print(f"x + y = {x + y}")

Per creare un vettore numerico quindi usiamo NumPy (il modulo NumPy e' importato come `np`, prasse comune nell'utilizzo della libreria), passando la lista alla funzione `array`:

In [None]:
x = np.array([0., 3.5, 4.])  # 0. e 4. sono di tipo float64, dato che viene aggiunto un punto alla fine

print(f"x = { x }")
print(f"type(x) = { type(x) }")

Per conoscere a posteriori il numero di elementi contenuti nel vettore possiamo usare l'attributo `shape`, il quale e' un dato `tuple`. In seguito (quando parleremo di matrici) vedremo più in dettaglio il significato di questo attributo. Per adesso, la dimensione del vettore e' data dall'unico elemento contenuto nella tupla, ossia `shape[0]`:

In [None]:
print(f"x.shape = {x.shape}")
print(f"x.shape[0] = {x.shape[0]}")

Tipicamente adoperiamo vettori reali però può risultare opportuno usare vettori le cui componenti sono numeri interi. Per creare un vettore di interi, la lista passata ad `array` deve contenere solo componenti `int64` (o varianti come `long`). Il vettore $\mathbf{x}$ definito sopra contiene entrate reali (tipo `float64`). Per conoscere il datatype delle componenti di un array NumPy, si puo' accedere all'attributo `dtype` dell'oggetto.

In [None]:
x_int = np.array([1, 2, 3])

print(f"x_int = {x_int}")
print(f"x_int.dtype = {x_int.dtype}")
print(f"x.dtype = {x.dtype}")

Se alcune entrate del vettore sono reali ed altre intere, NumPy converte automaticamente le entrate intere in entrate reali e otteniamo un vettore reale:

In [None]:
x = np.array([0, 3, 4.]) # notare che 4. è float64
print(f"x = {x}")

Esistono altri metodi per creare vettori. Tre casi importanti sono i seguenti:

1. il vettore nullo $\mathbf{0} = (0, \dots, 0)$, `np.zeros`
2. il vettore $\mathbf{1} = (1, \dots, 1)$ contenente 1 su ogni entrata, `np.ones`
3. vettori random, le cui componenti sono (pseudo-)casuali essendo campionate da una distribuzione di probabilità; per campionare dalla distribuzione uniforme in $[0, 1)$ si usa `np.random.rand`

Per crearli bisogna specificare solamente la dimensione del vettore:

In [None]:
d = 3

x_0 = np.zeros(d)
x_1 = np.ones(d)
x_rand = np.random.rand(d)

print(f"x_0 = {x_0}")
print(f"x_1 = {x_1}")
print(f"x_rand = {x_rand}")

Per indicizzare la componente $i$-esima di un vettore si usa la sintassi delle parentesi quadre (come con le liste Python). Lo stesso vale per lo slicing di sottovettori:

In [None]:
x = np.array([3., 2., 1., 0., -1., -2.])
print(f"x = {x}")

for i in range(3):
    print(f"x[{i}] = {x[i]}")

print(f"x[2:] = {x[2:]}")
print(f"x[:4] = {x[:4]}")
print(f"x[2:4] = {x[2:4]}")

##### Esercizi

1. Crea il vettore $\mathbf{x} = (1, \dots, 100) \in \mathbb{R}^{100}$
2. Crea un vettore di dimensione 10 campionato dalla distribuzione *gaussiana unitaria* (detta anche *normale* o *standard*). (hint: usare la documentazione online di NumPy)

In [None]:
# spazio lasciato per gli esercizi

### 1.b Visualizzare vettori

L'utilita' dei vettori sta nel poter modellare diversi tipi di dato utili nelle applicazioni. Classicamente i vettori sono stati introdotti per rapresentare quantita' geometriche tipiche della fisica (si pensi al concetto di forza in meccanica classica o in elettrodinamica), ma essi possono esprimere entità molto diverse tra di loro spaziando dalle onde sonore alle serie temporali in borsa. Per rendere più chiara questa idea visualizziamo alcuni esempi interessanti.

Iniziamo con la visualizzazione classica di un vettore come un segmento orientato nel piano / spazio. Nel caso di uno spazio vettoriale tutti i vettori sono centrati nell'origine. Per visualizzare una freccia in 2D tipicamente si usa la funzione `arrow` di Matplotlib. Noi invece useremo la funzione `quiver`, che verra' usata anche per altri scopi nelle lezioni future.

Warning: Matplotlib e' una libreria tanto utile quanto poco elegante. Non dovete imparare a memoria i commandi, l'importante e' ottenere i risultati voluti. Usate Google, o meglio ancora, ChatGPT per ottenere aiuto! Lo scopo del corso e' quello di comprendere bene la parte numerica!

In [None]:
def plot_vectors_2d(*xs, colors=None, title="", labels=None, xlim=1.2, ylim=1.2, head_width=0.04, head_length=0.1):
    # crea la figura (una figure puo contenere diversi assi cartesiani come subplot) con la dimensione in inch specificata in `figsize`
    fig = plt.figure(figsize=(6, 6))
    # aggiungiamo un'asse cartesiano alla figura
    ax = fig.add_subplot()
    # imposta il titolo
    ax.set_title(title)
    # disegna la freccia;
    # i primi due argomenti sono il punto (C_x, C_y) dove viene posizionata la coda della vettore
    # il terzo e il quarto argomento sono l'offset (δx, δy) relativo a (C_x, C_y), quindi la testa del vettore si troverà sul punto (C_x+δx, C_y+δy)
    # Gli argomenti `angles='xy'` e `scale_units='xy'` dicono a Matplotlib di rappresentare la freccia basandosi sulle sue componenti x e y,
    # mentre l'argomento `scale` imposta la lunghezza della freccia. Gli argomenti `width` e `color` vengono utilizzati per impostare la larghezza e il colore della freccia.
    for i, x in enumerate(xs):
        ax.quiver(0., 0., x[0], x[1], angles='xy', scale_units='xy', scale=1, width=0.01, color=colors[i])
        if labels:
            ax.text(x=x[0] / 2 + 0.1*x[0], y=x[1]/2, s=labels[i])
    # imposta l'intervallo delle x e y visualizzabili
    ax.set_xlim([-xlim, xlim])
    ax.set_ylim([-ylim, ylim])
   
    # imposta le label degli assi
    ax.set_xlabel('x')
    ax.set_ylabel('y')

In [None]:
x_2d = np.random.rand(2)

print(f"x_2d = {x_2d}")

In [None]:
plot_vectors_2d(x_2d, title="Un vettore 2D", colors=['red'])

Per visualizzare una freccia 3D, aggiungiamo un terzo argomento per la direzione della freccia nella dimensione z.

In [None]:
def plot_vectors_3d(*xs, colors=None, title="", labels=None, xlim=1.2, ylim=1.2, zlim=1.2):
    # crea la figura
    fig = plt.figure(figsize=(6, 6))
    # aggiunge un'asse; notare l'argomento aggiuntivo projection='3d', necessario per creare un asse 3D
    ax = fig.add_subplot(projection='3d')
    # imposta il titolo
    ax.set_title(title)
    for i, x in enumerate(xs):
        # disegna la freccia;
        # i primi tre argomenti sono il punto (C_x, C_y, C_z) dove viene posizionata la coda della vettore
        # il terzo, il quarto e il quinto argomento sono l'offset (δx, δy, δz) relativo a (C_x, C_y, C_z), quindi la testa del vettore si troverà sul punto (C_x+δx, C_y+δy, C_z+δz)
        # L'argomento `length` deve essere impostato a 1 (scoprirete il perche' nelle lezioni future), `arrow_length_ratio` indica quanto e' grande la punta della freccia,
        # `pivot` specifica la posizione della base della freccia (dovrebbe essere impostato su `tail`) e `color` imposta il colore della freccia.
        ax.quiver(0., 0., 0., x[0], x[1], x[2], length=1, arrow_length_ratio=0.3, pivot='tail', color=colors[i])
        # aggiunge la freccia all'asse
        if labels:
            ax.text(x=x[0] / 2 + 0.3*x[0], y=x[1]/2, z=x[2] / 2, s=labels[i])

    # imposta i limiti del plot come nell'esempio 2D
    ax.set_xlim([-xlim, xlim])
    ax.set_ylim([-ylim, ylim])
    ax.set_zlim([-zlim, zlim])

    # imposta le label degli assi
    ax.set_xlabel('x')
    ax.set_ylabel('y')
    ax.set_zlabel('z')

In [None]:
x_3d = np.random.rand(3)
print(f"x_3d = {x_3d}")

In [None]:
plot_vectors_3d(x_3d, title="Un vettore 3D", colors=['red'])

Quando il numero di componenti di un vettore $\mathbf{x} = (x_0, \dots, x_n)$ è maggiore di 3 possiamo trattare il vettore come una sequenza, ossia come un'applicazione $$s: [n] \to \mathbb{R},$$ dove $[n] = \{1, \dots, n\}$ è l'insieme dei numeri naturali da $1$ a $n$, ponendo $s(i) = x_i, \forall i \in [n]$. Come esempio possiamo visualizzare l'andamento del valore di Bitcoin nelle ultime due settimane (nel 2022). Carichiamo il file `bitcoin.txt` dal disco:

In [None]:
# apertura del file
f_bitcoin = open('bitcoin.txt')
# comprensione di liste per scorrere le righe del file (ogni riga e' un valore numerico) e convertire da `str` a `float`
data_bitcoin = [float(line) for line in f_bitcoin]
# abbiamo effetuato lo slicing degli ultimi 14 valori nella lista, corrispondenti alle ultime 2 settimane
bitcoin = np.array(data_bitcoin)[-14:]

print(f"bitcoin = { bitcoin }")

Per visualizzare una sequenza possiamo usare la funzione `plot` di Matplotlib. Il primo argomento e' un vettore contenente $[n]$ mentre il secondo contiene i valori di `bitcoin.txt`.

In [None]:
x = np.arange(1, 14 + 1) # np.arange(1, 14+1) e' equivalente a np.array(range(1,14+1)); ricordiamo che l'estremo destro del range e' escluso
y = bitcoin

fig = plt.figure(figsize=(8, 6))
ax = fig.add_subplot()
# imposta la label dell'asse x
ax.set_xlabel('Giorno')
# imposta la label dell'asse y
ax.set_ylabel('BTC / EUR')
ax.plot(x, y, '.-')
plt.show()

Vediamo cosa succede quando osserviamo l'andamento dal giorno `2013-04-29`. Per effettuare il plot bisogna conoscere il numero di elementi nel vettore, quindi lo scopriamo usando `shape`:

In [None]:
bitcoin_total = np.array(data_bitcoin)

In [None]:

fig = plt.figure(figsize=(8, 6))
ax = fig.add_subplot()
# imposta la label dell'asse x
ax.set_xlabel('Giorno')
# imposta la label dell'asse y
ax.set_ylabel('BTC / EUR')
ax.plot(np.arange(1, bitcoin_total.shape[0] + 1), bitcoin_total)
plt.show()

Avendo aggiunto un numero cospicuo di punti osserviamo che la sequenza "zoomata" ha l'aspetto di una funzione continua. Come visto nella lezioni teorica, le funzioni continue formano uno spazio vettoriale, quindi le funzioni sono a tutti gli effetti dei vettori.

### 1.c Operazioni su vettori

Introduciamo le principali operazioni che possiamo effetuare sui vettori. Come minimo, dobbiamo poter effettuare le due operazioni che definiscono uno spazio vettoriale, ossia la moltiplicazione per uno scalare e la somma tra due vettori. Iniziamo con la moltiplicazione per uno scalare, la quale e' un'operazione unaria rispetto al vettore. Altre operazioni unarie sono definite di seguito.

Possiamo rappresentare uno scalare in NumPy come un array 0-dimensionale, quindi per crearlo, invece di passare una lista alla funzione `array`, passiamo direttamente uno scalare di Python:

In [None]:
# scalare in NumPy
c = np.array(2.)

print(f"c = { c }")
print(f"type(c) = { type(c)}")
print(f"type(2.) = { type(2.) }")
print(f"c.dtype = { c.dtype }")
# l'operatore == restituisce vero tra uno scalare Python e la sua versione NumPy
print(f"2. == c = {2. == c}")

In [None]:
# moltiplicazione per scalare
x = np.array([0, 3, 4.])

print(f"np.array(2.) * x = { np.array(2.) * x }")
# la moltiplicazione per scalare è commutativa
print(f"x * np.array(2.) = { x * np.array(2.) }")
# moltiplicando per un'dtype int abbiamo la conversione automatica dell'int a float
print(f"x * np.array(2) = { x * np.array(2) }")
# usando il type float64 di Python otteniamo lo stesso risultato
# (in pratica usiamo sempre questo dato che risparmiamo di convertire manualmente lo scalare in NumPy)
print(f"2. * x = { 2. * x  }")

In [None]:
plot_vectors_3d(x, 2 * x, colors=['red', 'blue'], xlim=10., ylim=10., zlim=10., title="Moltiplicazione per uno scalare", labels=['$\mathbf{x}$', '$2\mathbf{x}$'])

Possiamo trasformare qualsiasi vettore in modo *point-wise*, applicando una funzione qualsiasi su ogni entrata del vettore. Se $f: \mathbb{R} \to \mathbb{R}$ e $\mathbf{x} = (x_1, \dots, x_n)$ allora $$ f(\mathbf{x})= (f(x_1), \dots, f(x_n)),$$ definisce una trasformazione $f: \mathbb{R}^n \to \mathbb{R}^n$ (abbiamo usato lo stesso nome $f$ per la funzione scalare e la funzione *point-wise* ma avendo la segnatura diversa (il dominio e il codominio) sono applicazioni diverse.

In [None]:
# funzione arbitraria sulle componenti

x = np.array([np.pi, 0., np.pi/2.])
y = np.array([0., 1.])
z = np.array([np.e, 1.])

print(f"np.sin(x) = { np.sin(x) }")
print(f"np.cos(x) = { np.cos(x) }")
print(f"np.exp(y) = { np.exp(y) }")
print(f"np.log(z) = { np.log(z) }")

Altre funzioni agiscono in modo *globale* (non puntuale) su un vettore. Tipicamente queste funzioni restituiscono uno scalare in output. Le più comuni sono il *massimo*, il *minimo*, la *media*. Troviamo il valore massimo, medio e minimo del valore in EUR del Bitcoin nel passato:

In [None]:
print(f"np.mean(bitcoin_total) = { np.mean(bitcoin_total) }")
print(f"bitcoin_total.mean() = { bitcoin_total.mean() }")     # in alternativa possiamo usare il metodo `mean` dell'oggetto
print(f"np.min(bitcoin_total) = {np.min(bitcoin_total)}")
print(f"np.max(bitcoin_total) = {np.max(bitcoin_total)}")

Un'operazione globale molto importante è la norma di un vettore: $$\Vert \mathbf{x} \Vert = \sqrt{x_1^2 + \dots + x_n^2}.$$ Per un vettore geometrico in $\mathbb{R}^2$ o $\mathbb{R}^3$ la norma e' la distanza tra la testa del vettore e l'origine. Più in generale con la norma possiamo definire distanze naturali tra vettori astratti in spazi vettoriali qualsiasi (riprenderemo questo discorso tra poche righe). In NumPy, la norma di un vettore può essere calcolata attraverso la funzione `linalg.norm` (presente nel sottomodulo `linalg`):

In [None]:
x = np.array([1., 2., 3.])
y = np.array([0., 2., 0.])

print(f"x = {x}")
print(f"y = {y}")

print(f"np.linalg.norm(x) = { np.linalg.norm(x) }")
print(f"np.linalg.norm(y) = { np.linalg.norm(y) }")

A questo punto possiamo usare quello che abbiamo visto fin'ora per creare (boomer alert!) un *simpatico orologio* ⏰! Usiamo due vettori, `hours` e `minutes`, e applichiamo su ognuno trasformazioni trigonometriche per ruotarli in senso orario: $$\begin{cases}x_{t+1} = \cos{(vt)}x_{t} - \sin{(vt)} y_t \\ y_{t+1} = \sin{(vt)}x_{t} + \cos{(vt)}y_{t}\end{cases}.$$ Nel seguente esempio facciamo compiere alla lancetta dei minuti 3 giri mentre quella delle ore ne compie uno (quindi ci troviamo su un pianeta che ruota $12 / 3 = 4$ volte più velocemente della Terra, considerando la stessa durata delle ore!).

In [None]:
%%capture
from matplotlib import animation, rc
from IPython.display import HTML
# richiesto per visualizzare l'animazione in Jupyter Notebook
rc('animation', html='html5')

minutes = np.array([0., 1.])
hours = np.array([0., 0.5])

v_hours = 2*np.pi
v_minutes = 3 * v_hours

head_width=0.04
head_length=0.1
color1 = 'red'
color2 = 'blue'

fig = plt.figure(figsize=(6, 6))
ax = fig.add_subplot()
frames = 100

def animate(t):
    ax.cla()
    ax.set_title("Orologio alieno")
    # il tempo e' parametrizzato da 0 a 1 (per questo usiamo t/frames)
    new_minutes = np.array([np.cos(v_minutes*t/frames)*minutes[0] + np.sin(v_minutes*t/frames)*minutes[1],
                       - np.sin(v_minutes*t/frames)*minutes[0] + np.cos(v_minutes*t/frames)*minutes[1]])
    new_hours =  np.array([np.cos(v_hours*t/frames)*hours[0] + np.sin(v_hours*t/frames)*hours[1],
                           - np.sin(v_hours*t/frames)*hours[0] + np.cos(v_hours*t/frames)*hours[1]]) 
    ax.quiver(0., 0., new_minutes[0], new_minutes[1], angles='xy', scale_units='xy', scale=1, width=0.01, color=color1)
    ax.quiver(0., 0., new_hours[0], new_hours[1], angles='xy', scale_units='xy', scale=1, width=0.01, color=color2)

    ax.set_xlim([-1.2, 1.2])
    ax.set_ylim([-1.2, 1.2])

# `interval` e' il delay tra i frame in ms
anim = animation.FuncAnimation(fig, animate, frames=frames, interval=20)

In [None]:
anim

Adesso possiamo passare alle operazioni binarie. Come detto in precedenza, l'operazione binaria fondamentale è la somma tra vettori. Riprendiamo l'esempio della Sezione 1.a:

In [None]:
# somma tra vettori
x = np.array([0, 3, 4.])
y = np.array([3., 4., -0.5])

print(f"x = {x}")
print(f"y = {y}")

print(f"x + y = {x + y}")
# la somma tra vettori gode della proprietà commutativa
print(f"y + x = {y + x}")

In [None]:
plot_vectors_3d(x, y, x + y, colors=['r', 'b', 'g'], xlim=10., ylim=10., zlim=10., title="Somma tra vettori", labels=['$\mathbf{x}$', '$\mathbf{y}$', '$\mathbf{x}+\mathbf{y}$'])

Un'altra operazione utile che possiamo effettuare con due vettori $\mathbf{x} = (x_1, \dots, x_n)$ e $\mathbf{y} = (y_1, \dots, y_n)$ della stessa dimensione è il *prodotto point-wise* $\mathbf{x} \odot \mathbf{y}$ (detto anche *prodotto di Hadamard*). Tale prodotto è semplicemente dato dal vettore avente per componenti i prodotti tra le singole entrate dei due vettori (notare la natura locale, simile alle operazioni point-wise unarie viste in precedenza), $$\mathbf{x} \odot \mathbf{y} = (x_1y_1, \dots, x_ny_n)$$

In [None]:
# prodotto point-wise tra vettori
x = np.array([0, 3, 4.])
y = np.array([3., 4., -0.5])

print(f"x = {x}")
print(f"y = {y}")

print(f"x * y = {x * y}")
# il prodotto point-wise gode della proprietà commutativa
print(f"y * x = {y * x}")

Infine, introduciamo il prodotto scalare tra due vettori in $\mathbb{R}^n$. Dati due vettori $\mathbf{x} = (x_1, \dots, x_n)$ e $\mathbf{y} = (y_1, \dots, y_n)$, il *prodotto scalare standard* (in inglese è detto *dot product* o *standard inner product*) è definito come $$\mathbf{x} \cdot \mathbf{y} = \langle \mathbf{x}, \mathbf{y} \rangle = x_1y_1 + \dots + x_ny_n.$$ Il nome di questo prodotto deriva dal fatto che l'output dell'operazione è uno scalare. Su uno spazio vettoriale $V$ possiamo definire una vasta gamma di prodotti scalari (se il campo dei scalari dello spazio vettoriale è l'insieme dei numeri complessi $\mathbb{C}$ si parla di *prodotti Hermitiani*, che hanno proprietà leggermente diverse dai prodotti scalari reali), ma lavoreremo principalmente con il prodotto scalare standard in $\mathbb{R}^n$, quindi sottindenderemo l'attributo standard in seguito.

Il prodotto scalare gode delle seguenti proprietà fondamentali:
1. Proprietà commutativa: $$\langle \mathbf{x}, \mathbf{y} \rangle =\langle \mathbf{y}, \mathbf{x} \rangle$$
2. Bilinearità: $$\langle \lambda_1 \mathbf{x}_1 + \mu_1 \mathbf{y}_1, \lambda_2 \mathbf{x}_2 + \mu_2 \mathbf{y}_2 \rangle =
\lambda_1\lambda_2 \langle \mathbf{x}_1, \mathbf{x}_2 \rangle +
\lambda_1\mu_2 \langle \mathbf{x}_1, \mathbf{y}_2 \rangle +
\mu_1\lambda_2 \langle \mathbf{y}_1, \mathbf{x}_2 \rangle +
\mu_1\mu_2 \langle \mathbf{y}_1, \mathbf{y}_2 \rangle$$
3. Definito positivo: $$x \neq \mathbf{0} \Rightarrow \langle \mathbf{x}, \mathbf{x} \rangle > 0$$

In $\mathbb{R}^n$ la norma di un vettore e' definita a partire dal concetto di prodotto scalare. Infatti:
$$ \Vert \mathbf{x} \Vert = \sqrt{x_1^2 + \dots x_n^2} = \sqrt{x_1x_1 + \dots + x_nx_n} = \sqrt{\langle \mathbf{x}, \mathbf{x} \rangle}.$$ Da notare che $\Vert \mathbf{x} \Vert^2 = \langle \mathbf{x}, \mathbf{x} \rangle$.

In NumPy il prodotto scalare viene effettuato con la funzione `inner` oppure con l'operatore `@`:

In [None]:
# prodotto scalare
x = np.array([1., 3., 5.])
y = np.array([0., -1., 2.])

print(f"np.inner(x, y) = {np.inner(x, y)}")
print(f"x @ y = {x @ y}")
# controlliamo che la norma di un vettore e' data dalla radice del prodotto scalare di un vettore con se stesso

print(f"np.linalg.norm(x) = {np.linalg.norm(x)}")
print(f"np.sqrt(x @ x) = {np.sqrt(x @ x)}")

##### Esercizi

1. Inverti il verso di rotazione dell'orologio.
2. Consideriamo $\mathbb{R}^n[x]$, lo spazio vettoriale dei polinomi di grado al più $n$ (dimostra che è in effetti uno spazio vettoriale). Qualsiasi polinomio $$p(x) = a_n x^n + \dots + a_1 x + a_0$$ può essere rappresentato dal vettore dei coefficienti $$\mathbf{x} = (a_n, \dots, a_0)$$ (contentente $n+1$ elementi). Disegna il polinomio rappresentato da $\mathbf{x} = (3., 2., 1., 2.)$. (Hint: definisci un vettore contenente punti sull'asse delle $x$, poi applica operazioni su questo vettore per ottenere il vettore delle rispettive $y$)

In [None]:
# spazio lasciato per gli esercizi

# 2.
xs = np.arange(-10, 10)
coeff = ...
ys = ...
# plt.plot(xs, ys)

### 1.d Combinazioni lineari, (In)Dipendenza lineare, Basi, Dimensione

Usando le operazioni di uno spazio vettoriale (somma tra vettori e moltiplicazione per uno scalare) possiamo scrivere un vettore usando altri vettori. Una scrittura di questo tipo è detta *combinazione lineare*. Per esempio: $$ (1, 2, 3) = 1 (1, 0, 0) + 2 (0, 1, 0) + 3 (0, 0, 1) = 1 \mathbf{e}_1 + 2 \mathbf{e}_2 + 3 \mathbf{e}_3$$

In [None]:
x = np.array([1., 2., 3.])
e1 = np.array([1., 0., 0.])
e2 = np.array([0., 1., 0.])
e3 = np.array([0., 0., 1.])

# quando utilizziamo l'operatore di uguaglianza == tra vettori, Numpy effettua tale operazione
# su ogni entrata restituendo un vettore booleano
print(f"x == e1 + 2*e2 + 3*e3 = {x == e1 + 2*e2 + 3*e3}")

# nel caso in cui vogliamo verificare l'uguaglianza tra vettori globalmente bisogna chiamare .all() sul vettore booleano,
# la funzione restituisce True solo se tutte le entrate sono True
print(f"(x == e1 + 2*e2 + 3*e3).all() = { (x == e1 + 2*e2 + 3*e3).all()}")

I coefficienti nella combinazione lineare precedente sono semplicemente $\lambda_1 = 1$, $\lambda_2 = 2$ e $\lambda_3 = 3$ avendo scritto $\mathbf{x}$ usando $\mathbf{e}_1 = (1, 0, 0), \mathbf{e}_2 = (0, 1, 0), \mathbf{e}_3 = (0, 0, 1)$. Se vogliamo scrivere lo stesso vettore come combinazione lineare di $\mathbf{x}_1 = (1, 0, 1), \mathbf{x}_2 = (0, 2, 0), \mathbf{x}_3 = (0, 2, 1)$ risulta più difficile trovare i coefficienti (Esercizio 1.d.1).

Come esempio ulteriore, carichiamo dal disco le due tracce audio `bass.wav` e `drums.wav`.

In [None]:
import librosa
sr = 44100
bass, _ = librosa.load('bass.wav', sr=sr)
drums, _ = librosa.load('drums.wav', sr=sr)

I dati musicali caricati sono segnali audio campionati a 44100 Hz, ossia ogni secondo di suono è rappresentato da 44100 componenti. Vediamo il numero di componenti totali nei due vettori:

In [None]:
print(f"bass.shape = {bass.shape}")
print(f"drums.shape = {drums.shape}")
print(f"drums.shape[0] / 44100 = {drums.shape[0] / sr}s = {drums.shape[0] / (sr * 60)}min")
print(f"bass.shape[0] / 44100 = {bass.shape[0] / sr}s = {drums.shape[0] / (sr * 60)}min")

Le due tracce hanno la stessa lunghezza, ossia 241 secondi (4 minuti). Visualizziamo il decimo secondo di entrambe le tracce.

In [None]:
t = 10 #
bass = bass[t*sr:(t+1)*sr]
drums = drums[t*sr:(t+1)*sr]

In [None]:
y = bass
x = np.arange(y.shape[0])

fig = plt.figure(figsize=(8, 6))
ax = fig.add_subplot()
ax.set_xlabel('t')
ax.set_title('Basso')
ax.plot(x, y, '-')
plt.show()

import IPython
IPython.display.Audio(y, rate=sr)

In [None]:
y = drums
x = np.arange(y.shape[0])

fig = plt.figure(figsize=(8, 6))
ax = fig.add_subplot()
ax.set_xlabel('t')
ax.set_title('Batteria')
ax.plot(x, y, '-')
plt.show()

IPython.display.Audio(y, rate=sr)

Effettuando la seguente combinazione lineare dei due vettori otteniamo la mistura:

In [None]:
mix = 0.5 * bass + 0.5 * drums
y = mix
x = np.arange(y.shape[0])

fig = plt.figure(figsize=(8, 6))
ax = fig.add_subplot()
ax.set_xlabel('t')
ax.set_title('Mistura')
ax.plot(x, y, '-')
plt.show()

IPython.display.Audio(y, rate=sr)

Se possiamo scrivere il vettore nullo $\mathbf{0}$ come combinazione lineare di un insieme di vettori $X$ dove almeno un coefficiente nella combinazione non è 0, allora i vettori in $X$ sono detti *linearmente dipendenti*. Per esempio:

In [None]:
x = np.array([1., 2., 3.])
e1 = np.array([1., 0., 0.])
e2 = np.array([0., 1., 0.])
e3 = np.array([0., 0., 1.])

print(f"(np.zeros(3) == 1*x - 1*e1 - 2*e2 - 3*e3).all() = { (np.zeros(3) == 1*x - 1*e1 - 2*e2 - 3*e3).all() }")

I vettori $\{\mathbf{x}, \mathbf{e}_1, \mathbf{e}_2, \mathbf{e}_3\}$ sono linearmente dipendenti avendo scritto il vettore $\mathbf{0}$ usando una combinazione lineare in cui almeno un coefficiente e' diverso da 0 (in questo caso, tutti i coefficienti sono diversi da 0). Se proviamo a scrivere il vettore $\mathbf{0}$ usando l'insieme  $\{\mathbf{e}_1, \mathbf{e}_2\}$ l'unica combinazione lineare possibile è la seguente: $$\mathbf{0} = 0\mathbf{e}_1 + 0\mathbf{e}_2 $$

L'insieme $\{\mathbf{e}_1, \mathbf{e}_2\}$ è detto *linearmente indipendente* (non essendo linearmente dipendente). Se possiamo scrivere *ogni* vettore $v$ di uno spazio vettoriale $V$ come combinazione lineare di un insieme di vettori linearmente indipendenti $B = \{b_1, \dots, b_n\}$, allora *B* è detto *base* di $V$ (in tal caso si dimostra che la combinazione lineare è unica). Il vettore $\mathbf{x} = (x_1, \dots, x_n)$ di $\mathbb{R}^n$ che contiene i coefficienti della combinazione lineare $\mathbf{v} = x_1 b_1 + \dots + x_n b_n$ è detto vettore delle *coordinate* di $\mathbf{x}$. Si può dimostrare che ogni spazio vettoriale ammette una base e che due basi di uno stesso spazio vettoriale contengono lo stesso numero di elementi (la *dimensione* dello spazio).

Per esempio una base di $\mathbb{R}^n$ è $\{\mathbf{e}_1, \dots, \mathbf{e}_n\}$, detta anche *base canonica* o *base standard*.

In [None]:
e1 = np.array([1., 0.,])
e2 = np.array([0., 1.])
x1 = np.random.rand(2)
x2 = np.random.rand(2) # è poco probabile (evento a misura nulla) ottenre un vettore linearmente dipendente a x1 (ossia che sta nella retta su cui poggia x1), ma comunque potrebbe stare vicino (in tal caso si può fare un refresh per avere un nuovo candidato più visualizzabile)
plot_vectors_2d(e1, e2, x1, x2, colors=['r', 'r', 'b', 'b'], title="Due basi", labels=['$\mathbf{e}_1$', '$\mathbf{e}_2$',
                                                                                       '$\mathbf{x}_1$', '$\mathbf{x}_2$'])

Il concetto di base ha un'importanza capillare nell'algebra lineare e nel calcolo numerico più in generale. Questo perchè avendo fissato una base $B$ in uno spazio vettoriale $V$ ($n$-dimensionale) qualsiasi, possiamo rappresentare tutti gli elementi di $V$ con i vettori delle coordinate rispetto alla base $B$. Quindi scelta una base $B$ ($n$-dimensionale), $V$ ha la stessa struttura di $\mathbb{R}^n$ e possiamo fare tutti i calcoli in quest'ultimo spazio.

Per esempio, come visto nell'esercizio sui polinomi, ogni polinomio di $\mathbb{R}^n[x]$ è in relazione biunivoca con un vettore di coefficienti in $\mathbb{R}^{n+1}$ scegliendo la base $B = \{1, x, x^2, \dots, x^n\}$:
$$v = 2x^2 + 3x + 1 \Rightarrow \mathbf{x} = (2, 3, 1)$$
$$v = -2x^3 - x^2 + 5 \Rightarrow \mathbf{x} = (-2, -1, 0, 5).$$

Quando lo spazio $V$ è $\mathbb{R}^n$, sia il vettore che vogliamo rappresentare che la rappresentazione in una base $B$ (il vettore delle coordinate) è una $n$-upla $(x_1, \dots, x_n)$. Per esempio possiamo considerare il vettore $(1, 2, 3)$: la sua rappresentazione rispetto alla base canonica è $(1,2,3)$ mentre se scegliamo per esempio la base $$B = \{(2, 1, -2), (2, 2, 2), (1, -1, 1)\},$$ la rappresentazione è $(-0.5, 1.125, -0.25)$. Come nota aggiuntiva, bisogna far attenzione al fatto che le entrate in un vettore di coordinate sono ordinate rispetto a un ordinamento dei vettori nella base. Per questo motivo, una base deve essere intesa come un insieme ordinato o una lista.
Controlliamo l'esempio precedente:

In [None]:
x = np.array([1, 2, 3])
b1 = np.array([2, 1, -2])
b2 = np.array([2, 2, 2])
b3 = np.array([1, -1, 1])
e1 = np.array([1., 0., 0.])
e2 = np.array([0., 1., 0.])
e3 = np.array([0., 0., 1.])

x_c = np.array([-0.5, 1.125, -0.25])
print(f"(x == x_c[0]*b1 + x_c[1]*b2 + x_c[2]*b3).all() = {(x == x_c[0]*b1 + x_c[1]*b2 + x_c[2]*b3).all()}")

In [None]:
plot_vectors_3d(x, b1, b2, b3, e1, e2, e3, colors=['g', 'r', 'r', 'r', 'b', 'b', 'b'], title="Due basi", labels=['$\mathbf{x}$', '$\mathbf{b}_1$',
                                                                                                                 '$\mathbf{b}_2$', '$\mathbf{b}_3$',
                                                                                                                 '$\mathbf{e}_1$', '$\mathbf{e}_2$',
                                                                                                                 '$\mathbf{e}_3$'],
                xlim=2.2, ylim=2.2, zlim=2.2)

Come visto sopra, spesso ci ritroviamo a usare due basi diverse $B_1$ e $B_2$ in $\mathbb{R}^n$ (tipicamente una delle due è la base canonica). Vedremo in seguito come effettuare *cambiamenti di base* (ossia come cambiano le coordinate passando da una base a un'altra). La situazione diventa più manegevole quando usiamo basi dette *ortonormali*. Due vettori $\mathbf{x}_1$ e $\mathbf{x}_2$ di $\mathbb{R}^n$ sono detti *ortogonali* se $\langle \mathbf{x}_1, \mathbf{x}_2 \rangle = 0$. Questa proprietà generalizza il concetto di angolo retto tra due vettori geometrici a spazi vettoriali finito-dimensionali in cui sia possibile definire il prodotto scalare. Inoltre se vale *anche* $\Vert \mathbf{x}_1 \Vert = \Vert \mathbf{x}_2 \Vert = 1$ (ossia hanno norma 1 entrambi), allora i due vettori sono detti *ortonormali*. Se i vettori di una base sono ortonormali a due a due allora la base è detta ortonormale. La base canonica è ortonormale:

In [None]:
e1 = np.array([1., 0., 0.])
e2 = np.array([0., 1., 0.])
e3 = np.array([0., 0., 1.])

print(f"np.linalg.norm(e1) = { np.linalg.norm(e1) }")
print(f"np.linalg.norm(e2) = { np.linalg.norm(e2) }")
print(f"np.linalg.norm(e3) = { np.linalg.norm(e3) }")
print(f"e1 @ e2 = { e1 @ e2 }")
print(f"e1 @ e3 = { e1 @ e3 }")
print(f"e2 @ e3 = { e2 @ e3 }")

Applicando le rotazioni alla base canonica in $\mathbb{R}^2$ otteniamo tutte le possibili basi ortonormali (a meno dell'ordinamento; possiamo ottenerle tutte considerando le riflessioni). Lasciamo per esercizio questo fatto.

Ritorniamo al cambiamento di base. Si dimostra che per ottenere le coordinate di un vettore $\mathbf{x}$ relative a una base ortonormale $B = \{ \mathbf{x}_1, \dots, \mathbf{x}_n \},$ basta effetuare il prodotto scalare con i vettori della base: $$\mathbf{x} = \langle \mathbf{x}, \mathbf{x}_1 \rangle \mathbf{x}_1 + \dots + \langle \mathbf{x}, \mathbf{x}_n \rangle \mathbf{x}_n$$
Per esempio:

In [None]:
x = np.array([1., 2.])
b1 = np.array([np.sqrt(2)/2, np.sqrt(2)/2])
b2 = np.array([-np.sqrt(2)/2, np.sqrt(2)/2])

print(f"{np.linalg.norm(b1) = }")
print(f"{np.linalg.norm(b2) = }")
print(f"{b1 @ b2 = }")

print(f"{((b1 @ x) * b1 + (b2 @ x) * b2 == x).all() = }")

Aspetta! Sembra che il teorema non vale! Eppure se stampio i due risultati separatamente, otteniamo:

In [None]:
print(f"{((b1 @ x) * b1 + (b2 @ x) * b2) = }")
print(f"{x = }")

Che stregoneria è questa 🔮? In verità se esaminiamo la seconda componente del primo membro, otteniamo:

In [None]:
print(f"{((b1 @ x) * b1 + (b2 @ x) * b2)[1] = }")

La componente calcolata non è esattamente 2. Questo fenomeno è legato alla rappresentazione in virgola mobile `float64`. Effettuare calcoli usando la rappentazione in virgola mobile può sempre portare un margine di errore. Per essere più robusti ad errori di rappresentazione numerica come questo possiamo usare la funzione `isclose` di NumPy in alternativa all'operatore di uguaglianza `==`:

In [None]:
print(f"{np.isclose((b1 @ x) * b1 + (b2 @ x) * b2, x).all() = }")

##### Esercizi

1. Scrivi il vettore $(1,2,3)$ nella base $B = \{(1, 0, 1), (0, 2, 0), (0, 2, 1)\}$
2. Dimostra che i vettori ottenuti applicando una rotazione a due vettori ortonormali sono ortonormali. Hint: usare la relazione trigonometrica fondamentale $$ \sin^2(\theta) + \cos^2(\theta) = 1$$

###### Ex. 1

Il coefficiente di $(1,0,1)$ è $1$, dato che la prima componente di $(0,2,0)$ e $(0,2,1)$ è $0$. Possiamo quindi procedere a combinare $(1,2,3) - (1,0,1) = (0, 2, 2)$: dato che la terza componente di $(0, 2, 0)$ è $0$, il coefficiente di $(0,2,1)$ è $2$. Calcoliamo $(0,2,2) - 2(0,2,1) = (0, -2, 0)$. Quindi il coefficiente di $(0,2,0)$ è $-1$. Ricapitolando, la soluzione è $(1, -1, 2)$.

## 2. Matrici


### 2.a Creazione di matrici

Avendo famigliarizzato con i vettori, non è molto complicato passare alle matrici.

Ricordiamo che una matrice $m \times n$ (reale) $X \in \mathbb{R}^{m\times n}$ è una tabella contenente numeri reali disposti su $m$ righe ed $n$ colonne: $$ \begin{bmatrix}X_{1,1}&  \dots & X_{1,n} \\ 
\vdots &  \ddots & \vdots \\ X_{m,1} & \dots & X_{m,n}\end{bmatrix}$$ 

In NumPy una matrice è rappresentata sempre da un oggetto di tipo `numpy.ndarray`, che contiene due *assi* (detti anche dimensioni in NumPy, termine che cercheremo di evitare dato che può essere confuso con il concetto di dimensione di uno spazio vettoriale) invece di uno solo come nel caso dei vettori. Nel caso della matrice precedente, il primo asse contiene $m$ entrate mentre il secondo $n$ entrate.

Possiamo creare delle matrici passando alla funzione `array` una lista di liste (invece che una semplice lista) oppure attraverso la funzione `random.rand`:

In [None]:
X1 = np.array([[1., 2.], [3., 4.]])
X2 = np.random.rand(2, 3) # passiamo il numero di righe e di colonne

print(f"X1 = {X1}")
print(f"X2 = {X2}")

Se uno dei due assi ha una sola entrata, allora ci riduciamo al caso precedente ed otteniamo un vettore. Diversamente dal caso precedente però, abbiamo due possibili modi per descrivere il vettore risultante: come vettore *riga* o vettore *colonna*. Per esempio:

In [None]:
x = np.array([1., 2., 3.])
row_x = np.array([[1., 2., 3.]])
column_x = np.array([[1.],[2.],[3.]])

print(f"x = {x}")
print(f"row_x = {row_x}")
print(f"column_x = {column_x}")


Tipicamente, la notazione del vettore con un singolo asse viene fatta coincidere con il vettore colonna. Per conoscere a posteriori il numero di entrate su ogni asse, possiamo usare l'attributo `shape`:

In [None]:
print(f"x.shape = {x.shape}")
print(f"row_x.shape = {row_x.shape}")
print(f"column_x.shape = {column_x.shape}")
print(f"X1.shape = {X1.shape}")

Per indicizzare le matrici usiamo di nuovo la sintassi con le parentesi quadrate come in Python.

In [None]:
X = np.array([[1.,2., 3.], [4.,5.,6.],[7.,8.,9.]])
print(f"X = {X}")

print(f"X[0, 2] = {X[0, 2]}")

# seleziona la prima riga (da notare che il risultato e' un vettore con 1 asse)
print(f"X[0, :] = {X[0, :]}")
# seleziona la prima colonna 
print(f"X[:, 0] = {X[:, 0]}")
# seleziona la sotto-matrice ottenuta prendendo i primi due indici per ogni asse
print(f"X[:2, :2] = {X[:2, :2]}")

Possiamo visualizzare il contenuto di una matrice usando la unzione `imshow` di Matplotlib:

Adesso mostriamo alcuni esempi di matrici importanti:

1. Matrice nulla $O$ in cui ogni entrata è uguale a 0: `np.zeros`
2. Matrice identità $I$ in cui ogni entrata diagonale è uguale a 1 mentre le altre sono uguali a 0: `np.eye`
3. Matrice diagonale $D$ in cui ogni entrata diagonale è diversa da 0 mentre le altre sono uguali a 0: può essere creata con `np.diag`

Vediamo come creare queste matrici in NumPy:

In [None]:
# matrice nulla; diversamente dal vettore zero, bisogna passare
# una tupla contenente il numero di entrate per ogni asse
print(f"np.zeros((2,3)) = {np.zeros((2,3))}")

# matrice identità (essendo quadrata, bisogna passare solo una dimensionalità)
print(f"np.eye(3) = {np.eye(3)}")

# matrice diagonale
# creiamo un vettore random
d = np.random.rand(3)
print(f"d = {d}")
# passiamo il vettore a diag per ottenere la matrice diagonale
print(f"np.diag(d) = {np.diag(d)}")


### 2.b Operazioni su matrici
  
Come visto nella lezione teorica, lo spazio delle matrici $\mathbb{R}^{m\times n}$ è uno spazio vettoriale. Quindi una matrice è a tutti gli effeti un vettore (in particolare possiamo rappresentare la tabella con un vettore numerico per esempio concatenando le righe o le colonne). Possiamo perciò effettuare le comuni operazioni di moltiplicazione per uno scalare e la somma. 


In [None]:
A = np.array([[1., 2., 3.], [4., 5., 6.], [7., 8., 9.]])
B = np.array([[10., 11., 12.], [13., 14., 15.], [16., 17., 18.]])

print(f"A = {A}")
print(f"B = {B}")

# moltiplicazione per scalare
print(f"2*A = {2*A}")

# somma tra matrici
print(f"A + B = {A + B}")

Con le matrici è possibile effettuare un'operazione importante, il prodotto tra matrici (in realtà anche con i vettori ma in tal caso coincide con il prodotto scalare). Il prodotto tra tue matrici $A \in \mathbb{R}^{m\times n}$ e $B^{n \times p}$ è dato dalla matrice $C^{m \times p}$ tale che $C_{ij} = \langle A_{i,:}, B_{:,j}\rangle$ (il prodotto scalare tra la riga $i$-esima di $A$ e la colonna $j$-esima di $B$). Per effettuare il prodotto tra matrici possiamo usare `np.matmul` o `@`. 

Warning: 
1. il prodotto tra matrici *non è* simmetrico!
2. `@` ha la stessa semantica di `np.inner` quando e' calcolato tra vettori (array di dimensione 1) e di `np.matmul` su array di dimensione > 1. `np.inner` su array di dimensione > 1 non e' equivalente a `np.matmul` (piu' dettagli nella documentazione di NumPy: https://numpy.org/doc/stable/reference/generated/numpy.inner.html)


In [None]:
A = np.array([[1., 2., 3.], [4., 5., 6.], [7., 8., 9.]])
B = np.array([[10., 11., 12.], [13., 14., 15.], [16., 17., 18.]])

print(f"A = {A}")
print(f"B = {B}")
print(f"np.matmul(A,B) = {np.matmul(A,B)}")
print(f"A @ B = {A @ B}")
print(f"B @ A = {B @ A}")
print(f"np.isclose(A @ B, B @ A).all() = {np.isclose(A @ B, B @ A).all()}")

Possiamo moltiplicare una matrice per un vettore (anche se quest'ultimo ha un solo asse). Il risultato è un vettore:

In [None]:
A = np.array([[1., 2., 3.], [4., 5., 6.], [7., 8., 9.]])
x = np.array([1., 0.5, 0.1])

print(f"A @ x = {A @ x}")

Con le matrici possiamo effettuare operazioni unarie che non possiamo effettuare con i vettori (quindi aventi un solo asse). La prima di queste operazioni è la *trasposizione*: data una matrice $X$, la sua trasposta è la matrice $X^T$, dove $X_{i,j}^T = X_{j, i}$. Per ottenere la trasposta possiamo usare sia l'attributo `T` che la funzione `transpose`:

In [None]:
X = np.array([[1., 2., 3.], [4., 5., 6.], [7., 8., 9.]])

print(f"X  = {X}")
print(f"X.T  = {X.T}")
print(f"np.transpose(X) = {np.transpose(X)}")

Se abbiamo una matrice *quadrata* $X$ le cui colonne sono linearmente indipendenti, allora esiste la matrice $X^{-1}$ (l'inversa di $X$), tale che $XX^{-1} = X^{-1}X = I$. Per controllare che le colonne di una matrice sono linearmente indipendenti possiamo verificare che il determinante della matrice ($\det(A)$) sia deverso da 0. Non approfondiamo il significato del determinante in questa lezione (lo vedremo nelle prossime lezioni), però usiamo la funzione `linalg.det` come metodo black-box. Per calcolare l'inversa si può usare la funzione `linalg.inv` di NumPy:

In [None]:
X = np.array([[1., -1., 3.], [4., 5., 6.], [7., 8., 9.]])

print(f"X  = {X}")
# il determinante è diverso da 0. quindi le 3 colonne sono linearmente indipendenti
print(f"np.linalg.det(X)  = {np.linalg.det(X)}")
print(f"np.linalg.inv(X) = {np.linalg.inv(X)}")

# controlliamo che vale XX^-1 = I
print(f"X @ np.linalg.inv(X)  = {X @ np.linalg.inv(X)}")

### Esercizi:
1. Una matrice $X$ è detta simmetrica se $X_{i,j} = X_{j,i}$. Definisci una funzione che genera matrici simmetriche casuali. (Hint: usa la trasposta)
2. Esprimi il cambiamento di base visto nella Sezione 1 come una moltiplicazione tra una matrice e un vettore.

In [None]:
# 1
n = 3
X = np.random.rand(n, n)
X = X @ X.T
print(f"X = {X}")