# [Numpy](https://numpy.org)

NumPy è una libreria fondamentale per eseguire calcoli vettoriali e matriciali in Python. Fornisce diversi oggetti, tra cui vettori multidimensionali, e numerose operazioni di algebra lineare eseguibili su tali vettori.  

NumPy non è un modulo predefinito di Python pertanto va installato separatamente.

Il package manager per la distribuzione Anaconda python è il comando `conda`. 
Con il comando `conda install pacchetto` si può installare un nuovo pacchetto nel proprio ambiente base.

Il comando `conda` non va eseguito nel notebook poiché non è un comando di python ma va eseguito in un terminale. In Jupyter Notebook, è possibile utilizzare il punto esclamativo `!` per eseguire comandi come se stessimo usando il terminale.

In [None]:
# L'opzione -y serve per accettare eventuali prompt del programma
# di installazione
import sys
!conda install numpy -y --prefix {sys.prefix}

Come abbiamo già visto il comando `import` ci permette di importare un modulo all'interno del nostro programma. Inoltre utilizzando il comando `as` possiamo  riferirci al modulo che si sta importando con il nome che definiamo.

In [None]:
import numpy

In [None]:
numpy.array([0, 1])

In [None]:
import numpy as np

In [None]:
np.array([0, 1])

Un vettore $n$-dimensionale (`ndarray`) è usato per contenere $n$ elementi ordinati tutti dello stesso tipo.

In [None]:
vettore = np.array([1, 2, 3])
vettore

In [None]:
type(vettore), isinstance(vettore, np.ndarray)

La dimensione di un vettore è definito dalla suo attributo `shape`, il quale è una tupla di $n$ interi non-negativi che specifica il numero di elementi in ogni dimensione.

In [None]:
# a è un vettore 1-dimensionale con 3 elementi
vettore.shape

In [None]:
# b è un vettore 2-dimensionale (matrice) con 2 righe e 3 colonne
matrice = np.array([(1, 2, 3), (4, 5, 6)])
matrice

In [None]:
type(matrice)

In [None]:
matrice.shape

L'attributo `dtype` contiene il tipo degli oggetti contenuti nel vettore.

In [None]:
# Vettore contiene interi in base 64
vettore.dtype

In [None]:
vettore_float = np.array([1.2, 2.5, 7.8])
vettore_float

In [None]:
# È sempre un'istanze di ndarray
type(vettore_float)

In [None]:
# Ma il suo dtype è float64 
vettore_float.dtype

Il `dtype` può essere specificato quando si inizializza un oggetto di tipo `ndarray`

In [None]:
# Senza specificare il dtype sarebbe int 
# ma forziamo la conversione a float
vettore_float = np.array([0, 1, 2], dtype = float)

In [None]:
vettore_float

In [None]:
vettore_float.dtype

NumPy mette a disposizone parecchie funzioni per creare vettori speciali.

`numpy.zeros(shape, dtype)` restituisce un nuovo vettore avente una certa shape e dtype, con tutti gli elementi uguali a zero.

In [None]:
# Una matrice 2x2 di zeri con dtype float 
mat = np.zeros((2, 2))
print(mat, mat.shape, mat.dtype)

`numpy.ones(shape, dtype)` restituisce un nuovo vettore avente una certa shape e dtype, con tutti gli elementi uguali a uno.

In [None]:
# Una matrice 3x4 di zeri con dtype int 
mat = np.ones((3, 4), dtype = int)
print(mat, mat.shape, mat.dtype)

`numpy.empty(shape, dtype)` restituisce un nuovo vettore avente una certa shape e dtype, senza inizializzare gli elementi.

In [None]:
# Una matrice 3x4 di elementi non inizializzati con dtype float 
np.empty((4, 1))

Comunemente anche se la classe `ndarray` permette di istanziare vettori di 
ogni dimensione tipicamente ci si riferisce alle diverse dimensioni in modo diverso:

- 0D: scalare
- 1D: vettore
- 2D: matrice
- 3D+: tensore

In [None]:
# Un tensore 2x3x4 con tutti gli elementi a 1
tensore = np.ones((2, 3, 4))
tensore

Gli oggetti di tipo `ndarray` possono essere indicizzati con la sintassi standard di Python, ovvero `array[index]` come nel caso delle liste.

In [None]:
vettore

In [None]:
# L'elemento di posto 0
vettore[0]

In [None]:
# Gli elementi dal secondo in poi
vettore[1:]

In [None]:
matrice

In [None]:
# L'elemento di posto 0 è la prima riga
matrice[0]

In [None]:
# L'elemento di posto 1 è la seconda riga
matrice[1]

In [None]:
# Per estrarre un solo elemento dobbiamo usare due indici 
# uno per ogni dimensione
matrice[0][1]

In [None]:
# Equivalentemente in una sola parentesi
matrice[0, 1]

Con gli `ndarrray` si possono eseguire anche indicizzazioni più complesse per esempio usando le liste.

In [None]:
vettore

In [None]:
# Nuovo vettore che contiene gli elementi estratti 
# da vettore usando gli indici della lista
vettore[[0, 0, 1, 0]]

In [None]:
l = [1, 2, 3]

In [None]:
l[1:]

In [None]:
l[0]

In [None]:
# La stessa cosa non si può fare con le liste
l[[0, 0, 1, 0]]

Ai vettori si possono applicare gli operaratori di confronto: se si confronta un vettore con uno scalare si ottiene un vettore contenente i confronti elemento per elemento.

In [None]:
x = np.array([20, 30, 40, 50])
x

In [None]:
x > 35

Vettori boolenni come quello appena ottenuto possono a loro volta essere usati per indicizzare un vettore della medesima dimesione.

In [None]:
# Estraiamo il sottovettore degli elementi maggiori di 35
x[x > 35]

In [None]:
# Stessa cosa con una lista di booleani
x[[False, False,  True,  True]]

È possibile assegare un valore ad un sottoinsieme di un `ndarray`

In [None]:
tensore

In [None]:
tensore[0, 0, 2] = 5
tensore

In [None]:
tensore[0, 0, 2:] = 5
tensore

`numpy.arange` è l'analogo in Numpy di `range`.

In [None]:
list(range(0, 10))

In [None]:
np.arange(0, 10)

In [None]:
list(range(0, 10, 2))

In [None]:
np.arange(0, 10, 2)

`numpy.linspace(a, b, n)` restituisce un vettore avente un specifico numero di elementi `n` equispaziati su un certo intervallo [`a`,`b`].

In [None]:
np.linspace(0, 10, 2)

In [None]:
np.linspace(0, 8, 5)

Di deafult il valore di `b` è incluso con `endpoint=False` si ottiene il seguente risultato.

In [None]:
np.linspace(0, 8, 5, endpoint = False)

In [None]:
np.linspace(0, 8, 7)

### Operazioni fra vettori

Con gli `ndarray` si possono eseguire tutte le operazioni dell'algebra vettoriale.

In [None]:
v1 = np.array([1, 2, 3])
v2 = np.array([1.2, 2.5, 7.8])

Sommando due vettori si ottiene la somma vettoriale fra i due che differeisce da quanto visto per le liste

In [None]:
v1 + v2

In [None]:
list(v1) + list(v2)

Per sommare due liste come se fossero vettori dovremmo usare un ciclo for o una list comprehension

In [None]:
somma = []
for i in range(len(v1)):
    somma.append(v1[i] + v2[i])
somma

In [None]:
[v1[i] + v2[i] for i in range(len(v1))]

Come la somma tutte le altre opeazioni aritmetiche vengono eseguite elemento per elemento

In [None]:
v1 * v2

In [None]:
v1 - v2

In [None]:
v1 / v2

In [None]:
vettore

In [None]:
matrice

Fintanto che le shape di due vettori sono compatibili anche se non uguali gli operatori aritmetici continuano ad essere utilizzabili con risultati spesso utili

In [None]:
print(matrice.shape, vettore.shape)

Qui vettore viene considerato come vettore riga (shape = (1, 3)) e quindi la sottrazzione funziona per righe poiché le dimensioni di colonna coincidono.

In [None]:
matrice - vettore

In [None]:
# Invece le shape (3, 3) e (2, 3) non sono compatibili
np.zeros((3, 3)) - np.zeros((2, 3))

NumPy include al suo interno diverse costanti predefinite, come `Inf` e `pi`.

In [None]:
np.pi

In [None]:
np.Inf

In [None]:
type(np.Inf)

In [None]:
np.e

Al suo interno poi troviamo le funzioni matematematiche per esempio quelle trigonometriche quali $\sin(x)$ e $\cos(x)$.

In [None]:
np.cos(0)

In [None]:
np.sin(0)

Come abbiamo detto le operazioni aritmetiche lavorano elemento per elemento. 
Ma nel caso delle matrici il prodotto matriciale non è quello elemento per elemento.

In algebra lineare se due matrici $A$ di dimensioni $n\times m$ e $B$ di dimensioni 
$m \times p$ vengono moltiplicate la matrice prodotto di dimensioni $n\times p$ si calcola con
$$
(A \cdot B)_{ij} = \biggl(\sum_{k=1}^m a_{ik} b_{kj}\biggr) 
$$

In [None]:
# Definiamo due matrici 2x2
A = np.array([[1, 1], [0, 1]])
B = np.array([[2, 0], [3, 4]])

In [None]:
A, B

In [None]:
A + B

\* produce il prodotto elemento per elemento (se le shape sono compatibili)

In [None]:
A * B

@ produce il prodotto matriciale (se le matrici sono moltiplicabili)

In [None]:
A @ B

La stessa cosa si può ottenere anche con le funzioni `matmul` o `dot` del modulo NumPy

In [None]:
np.matmul(A, B)

In [None]:
np.dot(A, B)

Nel caso di vettori dimensionali con $n$ elementi invece `dot` restituisce il prodotto scalare
$$
<a, b> = \sum_{i=1}^n a_i b_i
$$

In [None]:
np.dot(v1, v2)

Nella libreria sono poi definite molte funzioni (che possono essere chiamate anche come metodi delle istaze di `ndarray`) per il calcolo di funzioni di natura statistica.

In [None]:
# Minimo
np.min(vettore), vettore.min()

In [None]:
# Massimo
np.max(vettore), vettore.max()

In [None]:
# Media aritmetica
np.mean(vettore), vettore.mean()

In [None]:
# Deviazione standard
np.std(vettore), vettore.std()

In [None]:
# Varianza
np.var(vettore), vettore.var()

Per esempio la funzione che calcola la mediana invece non è disponibile come metodo di classe poiché in generale non è definita per i vettori multidimensionali.

In [None]:
np.median(vettore)

In [None]:
vettore.median()

Il metodo `reshape` cambia la shape del vettore senza cambiare i dati contenuti in esso.

In [None]:
vec = np.arange(12)
vec

In [None]:
vec.shape

In [None]:
# Cambiamo la shape di vec da (12, 1) a (3, 4)
mat = vec.reshape(3, 4)
mat

In [None]:
mat.shape

In [None]:
vec.sum()

I metodi `min`, `max`, `sum`... possono essere calcolati solo su alcune dimensioni di un `ndarray`.

In [None]:
# Somma per colonne ovvero lungo la prima dimensione
mat.sum(axis = 0)

In [None]:
# Somma per righe ovvero lungo la seconda dimensione
mat.sum(axis = 1)

Si può passare -1 al metodo reshape per far calcolare a NumPy il numero di elementi in quella dimensione

In [None]:
# Vogliamo mat con una shape di una sola dimensione quindi di 12 elementi
vec2 = mat.reshape(-1)
vec2

In [None]:
mat.reshape(3, -1)

`numpy.ravel` permette di 'appiattire' un array ad una sola dimansione.

In [None]:
# Equivalente a mat.reshape(-1)
np.ravel(mat)

Il modulo `random` che abbiamo già introdotto è usatro per la generazione di numeri pseudo casuali.

In [None]:
import random

In [None]:
random.randint(0, 10)

Anche NumPy ha un sottomodulo random che permette di generare vettori i cui elementi sono numeri pseuso casuali.

`numpy.random.normal(mean=0.0, std=1.0, shape)` genera vettori estratti da una distribuzione Gaussiana.
$$
\mathcal{N}(\mu, \sigma^2)
$$

In [None]:
# Vettore di dimensione 10 estratto da N(0,1) normale standard
np.random.normal(10)

In [None]:
mu = 0
sigma = 1

sample = np.random.normal(mu, sigma, 100)

Se calcoliamo le stime campionarie di media e deviazione standard otteniamo i risultati attesi

In [None]:
sample.mean(), sample.std()

La stima diventa più precisa all'aumentare della dimensione del campione

In [None]:
sample = np.random.normal(mu, sigma, 10000)
sample.mean(), sample.std()

`random.uniform(low=0.0, high=1.0, size=None)` genera vettori estratti da una distribuzione Uniforme.
$$
\mathcal{U}([low, high))
$$

In [None]:
# Vettore di dimensione 10 estratto da N(0,1) normale standard
np.random.uniform(0, 1, 10)

In [None]:
np.random.uniform(0, 1, (5, 5))

## Esercizi

Definire la funzione `inversa`. Tale funzione prende in ingresso una matrice e 
- per prima cosa controlla che sia una matrice e che sia quadrata, altrimenti restituisce un errore e termina la funzione restituendo `None`. 
- calcola il determinante della matrice con la funzione `numpy.linalg.det(matrice)`
- se il determinante è maggiore di 0.0001 calcola la matrice inversa con la funzione `numpy.linalg.inv(matrice)` e la restituisce come output.

Definite le matrici e i vettori
$$
A = \begin{pmatrix}
    0 & 1 & 2\\
    -1 & 2 & 1\\
    1 & 0 & -2\\
    \end{pmatrix}\quad
B = \begin{pmatrix}
3 & 2\\
0 & -1\\
1 & 1 \\
\end{pmatrix}\quad
v = \begin{pmatrix}
1\\
-1\\
1 \\
\end{pmatrix}\quad
w = \begin{pmatrix}
0\\
-1\\
2 \\
\end{pmatrix}
$$
calcolare $AB$, $Av$, $Av + w$ e $<Av, Aw>$

Istanziare un tensore di dimensioni (5, 3, 3) le cui entrate sono estratte da una distribuzione normale standard.

Dopodiché sostituire tutti e soli i valori negativi con 0.

Calcolare media, varianza e mediana del tensore ottenuto.

Scrivere una funzione che:
- prende in ingresso una matrice $X$ di dimensione ($n$, $m$)
- restituisce una matrice $Y$ di dimensione ($n$, 2) contenente le medie e le varianza per riga di $X$.

Creare una classe `Titolo` che rappresenta un titolo misurato anno per anno. La classe dovrà avere i seguenti attributi:
- `nome`: string, nome del titolo
- `titolo`: numpy.array, vettore contenente le rilevazioni del titolo
- `periodo`: numpy.array, vettore contenente i periodi corrispondenti alle rilevazioni

e i seguenti metodi:
- `__len__` calcola la lunghezza del titolo.
- `indice_base_fissa(base)` che restituisce l'indice a base fissa calcolato con base il periodo `base`.
- `indice_base_mobile()` che restituisce l'indice a base mobile del titolo.
- `variazione_media(t1, t2)` che restituisce la variazione media del titolo fra il periodo `t1` e il periodo `t2`. 

Definire poi una funzione che, preso in ingresso un `Titolo` resituisca la matrice $M$ di dimensione ($n$, 4) con $n$ la lunghezza del titolo. La matrice $M$ contiene nella prima colonna il periodo, nella seconda il titolo, nella terza l'indice a base fissa (con base il primo periodo) e nella quarta l'indice a base mobile. 