# 1. Introduzione 

## 1.1 Creazione ambiente di sviluppo

Le librerie più utilizzate in ambito ML e sopratutto il calcolo scientifico sono le seguenti: 
-  Jupyter notebook: una libreria che permette di condensare il lavoro in delle piccole celle e che aggiunge alcune funzioni particolari, che saranno esplorate successivamente;
-  Numpy: questa libreria ci permette di semplificare molte delle operazioni con matrici e vettori, in particolare la sintassi di Numpy è molto simile a quella di Matlab;
- Altre librerie saranno analizzate e discusse in caso di necessità.


Possiamo iniziare con alcune operazioni di base, per iniziare dobbiamo infatti scaricare ed importare alcune librerie: 
-  Il download di Jupyter notebook in primis, lo strumento che stiamo utilizzando in questo momento, è molto semplice, basta infatti, una volta scaricata una qualsiasi versione di Python 3 (dotata del package manager pip), scrivere nella Shell: ```pip install jupyter notebook```; (anche se Jupyter rientra all'interno delle librerie per semplicità, questo è uno strumento interattivo che permette di utilizzare Markdown e codice che esegue al momento, ne parleremo successivamente in modo più specifico)
- Lo stesso vale per le librerie che scaricheremo e utilizzeremo successivamente. ```pip install __nome libreria__```

Possiamo notare due cose interessanti rispetto all'ambiente di sviluppo per applicazioni su Python: 
- Molte delle applicazioni hanno delle specifiche differenti, per specifiche si intende per la maggior parte, l'insieme delle librerie necessarie per eseguire un programma, è utile nella maggior parte dei casi costruire un ambiente virtuale, ovvero un container che abbia al suo interno tutte le librerie necessarie per seguire script. Per fare questo utilizzeremo una libreria importantissima, ovvero __venv__, che sta proprio a significare __virtual environments__.
In particolare per utilizzare venv, basta runnare ```python3 -m venv myenv```, dove myenv è il nome della directory del futuro venv.
Una volta creata la cartella del venv, bisogna necessariamente attivarlo, questo è possibile farlo runnando dalla shell nella cartella del venv: ```source myenv/bin/activate``` dove __myenv__ è un nome arbitrario che sta ad indicare il nome selezionato del proprio ambiente personale. 
- Una cosa interessante che ci permette di fare Jupyter è quella di scaricare delle librerie direttamente sul notebook, segue un esempio di codice:

In [None]:
## --> !pip install <nome_libreria> (per utenti Windows e MacOS)
## --> pip install <nome_libreria> (utilizzando ipykernel)

#Comandi Shell per scaricare ipykernel e farlo puntare al venv

#attivare il venv source venv/bin/activate nella cartella del progetto
#scaricare all'interno del venv la libreria: pip install ipykernel

#runnare il comando:
#python -m ipykernel install --user --name=myenv --display-name "Python (myenv)"
#dove --name è il nome del venv e --display-name è il nome che appare in jupyter
#selezionare su Jupyter Notebook: Kernel -> Change Kernel -> il display-name selezionato 


Altrimenti, nel caso caso di linux, oppure per utenti avanzati di altri sistemi operativi, è possibile tramite la libreria di ipykernel, far puntare il kernel di jupyter al kernel del venv, di conseguenza tutte le librerie scaricare su jupyter andranno automaticamente nel venv.
Il caso degli utenti Linux è particolare, infatti per questioni di gestione delle dipendenze non è possibile scaricare librerie tramite il pip (se non dentro il venv), ma è necessario farlo con __apt__.
La soluzione con ipykernel è quella più consigliata ma, per questioni di brevità non sarà trattata o almeno non adesso, per gli utenti più curiosi basta utilizzare le relative documentazioni.

### Esercizio 1
Provare ad installare le seguenti librerie __inline__ (cioè mentre il codice esegue) su Jupyter Notebook, importarle e successivamente stampare "l'ambiente di sviluppo è pronto":
- Numpy;
- Matplotlib;
- Pandas;

In [None]:
"""inserire il corpo dell'esercizio"""

## 1.2 Cenni di algebra lineare 

L'algebra lineare è uno degli strumenti principali nell'analisi dei dati e nel machine learning, questo perchè fondamentalmente, ogni dato può essere rappresentato utilizzando certe cordinate in uno spazio cartesiano (euclideo) ed n-dimensionale. Una delle librerie fondamentali, pilastro del calcolo scientifico, è proprio __Numpy__. Immaginiamo di avere un sistema di equazioni lineari:


\begin{cases}
a_{11}x_{1} + a_{12}x_{2} + \cdots + a_{1n}x_{n} = b_{1}\\
a_{21}x_{1} + a_{22}x_{2} + \cdots + a_{2n}x_{n} = b_{2}\\
\;\vdots \\
a_{m1}x_{1} + a_{m2}x_{2} + \cdots + a_{mn}x_{n} = b_{m}
\end{cases}



Che può essere rappresentato in forma matriciale attraverso tre matrici:
1. __la matrice A dei coefficienti__ :


\begin{bmatrix}
a_{11} & a_{12} & \cdots & a_{1n}\\
a_{21} & a_{22} & \cdots & a_{2n}\\
\vdots & \vdots & \ddots & \vdots\\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{bmatrix}

2. La matrice __delle incognite x__:
\begin{bmatrix}
x_{1}\\ x_{2}\\ \vdots\\ x_{n}
\end{bmatrix}

3. La matrice dei __termini noti__:
\begin{bmatrix}
b_{1}\\ b_{2}\\ \vdots\\ b_{m}
\end{bmatrix}.

Attraverso una notazione matriciale, il sistema lineare è isomorfo alla matrice __Ax=b__,ovvero, in forma espansa:
$$
\begin{bmatrix}
a_{11} & a_{12} & \cdots & a_{1n}\\
a_{21} & a_{22} & \cdots & a_{2n}\\
\vdots & \vdots & \ddots & \vdots\\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{bmatrix}
\begin{bmatrix}
x_{1}\\
x_{2}\\
\vdots\\
x_{n}
\end{bmatrix}
=
\begin{bmatrix}
b_{1}\\
b_{2}\\
\vdots\\
b_{m}
\end{bmatrix}
$$



Numpy ci permette di creare propriamente queste matrici. Facciamo un passo indietro e valutiamo il funzionamento del tipo __array__ in Python. Matematicamente sappiamo che per definizione, una sequenza di valori 
\(\mathbf{v} = [x_1, \dots, x_n]\) è definita come vettore se:

1. Moltiplicazione per scalare:
$$
\forall \lambda \in \mathbb{R}, \quad
\lambda \mathbf{v} = 
\begin{bmatrix}
\lambda x_1 \\
\lambda x_2 \\
\vdots \\
\lambda x_n
\end{bmatrix}
$$

2. Somma di vettori:
$$
\forall \mathbf{v}, \mathbf{w} \in \mathbb{R}^n, \quad
\mathbf{v} + \mathbf{w} =
\begin{bmatrix}
v_1 + w_1 \\
v_2 + w_2 \\
\vdots \\
v_n + w_n
\end{bmatrix}
$$





In [None]:
''' Proviamo a vedere se i tipi standard di python riescono a soddisfare 
le proprietà appena enunciate'''

l1 = [1,2,3]
l2 = [1,2,3]

print(2*l1)
print(l1+l2)

''' Come è possibile notare in realtà gli array in Python non soddisfano di base
le proprietà richieste, o almeno non nativamente, è possibile però definire una classe
vettore con i propri metodi'''

class Vector:
    def __init__(self, data):
        self.vector = data # data è una lista di numeri
    
    def vector_sum(self, v2):
        if len(self.vector) != len(v2.vector):
            raise ValueError("I vettori devono avere la stessa lunghezza")
        res = []
        for i in range(len(self.vector)):
            res.append(self.vector[i] + v2.vector[i])
        return Vector(res)  # restituisce un nuovo oggetto Vector
    
    def scalar_mult(self, scalar):
        res = []
        for i in range(len(self.vector)):
            res.append(self.vector[i] * scalar)
        return Vector(res)
    
    def __repr__(self):
        return f"Vector({self.vector})"

'''Verifichiamo se soddisfa le proprietà richieste da un tipo vettore'''

v1 = Vector(l1)
v2 = Vector(l2)

print(v1,v2)

print(v1.vector_sum(v2),v2.vector_sum(v1))

print(v1.scalar_mult(2))
            


Com'è possibile notare, è in realtà molto semplice creare una classe vettore che abbia le caratteristiche matematiche desiderate. La cosa interessante è che, grazie a numpy è tutto più semplice ed efficiente (non a caso molte delle librerie sono scritte in C), e questo, insieme all'ottima documentazione di numpy, rende preferibile l'utilizzo delle librerie standard di calcolo scientifico, piuttosto che quelle create dall'utente.

Tutto questo discorso, anche se leggermente più complicato, vale per le matrici, ed è proprio qui che ci viene in soccorso numpy. Prima di partire però, è utile ricordare alcune caratteristiche proprie del Jupyter Notebook. In particolare due funzioni:
1. La funzione ```?``` che restuisce la docstring (una piccola descrizione) della funzione o del tipo richiesto;
2. La funzione ```??``` che restituisce, oltre che la docstring, anche il codice sorgente e molte più informazioni sulla funzione o tipo richiesto.

Segue un esempio:

In [None]:
int?
int??

Non sono solo le funzioni standard di Python ad avere queste funzioni, in realtà qualsiasi utente può scrivere una docstring che la accompagna, ad esempio:

In [None]:
def int_sum(a1,a2):
    ''' This function return the sum of two int type'''
    return a1 + a2
int_sum?

Una volta discusse tutte queste questioni possiamo iniziare a considerare la prima libreria.

### Esercizio 2
Creare una classe Matrix, che abbia i metodi di __somma tra matrici__, __prodotto tra matrici__ e __prodotto di una matrice per uno scalare__. Accompagnare inoltre ogni metodo con una docstring.

In [None]:
"""inserire il corpo dell'esercizio"""