# Python Lab 00c: Algebra Lineare in Python
## Francesco Della Santa, Matematica per l'Intelligenza Artificiale, Politecnico di Torino

Il pacchetto "per eccellenza" per eseguire calcolo scientifico di base in Pyhton è **numpy**. La sua estensione, per il calcolo scientifico avanzato, è invece **scipy** (di fatto, scipy "include" numpy).

Per convenzione questi due pacchetti si importano con le abbreviazioni **np** e **sp**, cioè usando i comandi:
- import numpy as np
- import scipy as sp

In questo notebook illustriamo brevemente i comandi base di numpy per l'algebra lineare. Per maggiori informazioni: https://numpy.org/

In [1]:
# ***** ATTENTION! *****
# If you want that the "%matplotlib widget" works, you need the package ipympl (pip install ipympl)
#
#
# MATPLOTLIB INTERACTIVE VISUALIZATION. REMOVE (OR COMMENT) IF YOU NEED TO PRINT THE NOTEBOOK AS A PDF, SOMETIMES IT DOES NOT WORK WELL...
%matplotlib widget
#
#

from IPython.display import display  # to display variables in a "nice" way
from IPython.display import Image  # to import images "exportables" to PDF
import matplotlib.pyplot as plt
import numpy as np


## ND-Arrays

Gli oggetti di lavoro principali di numpy (e scipy) sono i cosiddetti **ndarrays** (che chiamereo più semplicemente "**arrays**"), i quali sono sequenze multi-dimensionali di oggetti ordinati (similmente alle liste e le tuple). 

Questi array sono utilizzati per rappresentare vettori, matrici e tensori. La creazione di tali oggetti avviene tramite la funzione **array** di numpy. Potete leggere la descrizione completa della funzione nell'output della cella di seguito a questa.
Tuttavia, per i nostri scopi, ci interesseremo alla creazione di array tramite apposita funzione utilizzando solamente i due seguenti argomenti di input:
1. **object**
1. **ndmin**

In [2]:
help(np.array)

Help on built-in function array in module numpy:

array(...)
    array(object, dtype=None, *, copy=True, order='K', subok=False, ndmin=0,
          like=None)

    Create an array.

    Parameters
    ----------
    object : array_like
        An array, any object exposing the array interface, an object whose
        ``__array__`` method returns an array, or any (nested) sequence.
        If object is a scalar, a 0-dimensional array containing object is
        returned.
    dtype : data-type, optional
        The desired data-type for the array. If not given, NumPy will try to use
        a default ``dtype`` that can represent the values (by applying promotion
        rules when necessary.)
    copy : bool, optional
        If true (default), then the object is copied.  Otherwise, a copy will
        only be made if ``__array__`` returns a copy, if obj is a nested
        sequence, or if a copy is needed to satisfy any of the other
        requirements (``dtype``, ``order``, etc.).
  

#### FARE ATTENZIONE AL dtype:

L'argomento **dtype** è quasi sempre presente come opzione facoltativa da specificare nelle funzioni che creano array (incluse quelle che utilizzeremo nelle prossime celle). Questo argomento è importante da conoscere perché serve a specificare/imporre alla funzione come interpretare i dati che comporranno l'array, cioè se i valori saranno booleani, interi, float, ecc.. Se non indicato, il dtype verrà dedotto dai valori in ingresso.

**ATTENZIONE**: numpy *ha le proprie tipologie di dati* per gli interi, i float, ecc.; per esempio: np.int8, np.int16, np.int32, np.int64, np.float16, np.float32, np.float64, np.float128 (il numero dopo il tipo di dato indica i bit utilizzati per scrivere il numero nella memoria del computer).

### Dimensioni degli Array

Gli array possono avere un numero arbitrario di **assi** (spesso chiamati anche **dimensioni dell'array**); più specificatamente un numero di assi tra 0 e 32 (per limiti computazionali).
Quindi, gli **0D**-arrays altro non sono che una rappresentazione di numeri scalari in numpy. 

Più in generale:
- **0D**-array sono scalari
- **1D**-arrays sono array di 0D-arrays (vattori "scritti come liste")
- **2D**-arrays sono array di 1D-arrays (matrici)
- **3D**-array sono arrays of 2D-arrays (tensori 3D, p.e. immagini RGB)
- ...

#### Creare Array da Liste
Uno 0D-array si crea dando in input un valore scalare alla funzione np.array. Quindi, in generale, per creare un **ND**-array, l'input della funzione np.array  sarà una lista di **N liste** di **N-1 liste** di ... **ricorsivamente**.

#### Esempi
- esempio di uno stesso **0D**-array scritto come scalare, vettore, matrice e tensore:

In [3]:
for nd in range(4):
    print('-------------------------')
    print(f'0D-array with {nd} axes:')
    print('')
    display(np.array(1., ndmin=nd))
    print('-------------------------')

-------------------------
0D-array with 0 axes:



array(1.)

-------------------------
-------------------------
0D-array with 1 axes:



array([1.])

-------------------------
-------------------------
0D-array with 2 axes:



array([[1.]])

-------------------------
-------------------------
0D-array with 3 axes:



array([[[1.]]])

-------------------------


- esempio di uno stesso **1D**-array scritto come vettore, matrice e tensore:

In [4]:
for nd in range(1, 4):
    print('-------------------------')
    print(f'1D-array with {nd} axes:')
    print('')
    display(np.array([1., 0.5], ndmin=nd))
    print('-------------------------')

-------------------------
1D-array with 1 axes:



array([1. , 0.5])

-------------------------
-------------------------
1D-array with 2 axes:



array([[1. , 0.5]])

-------------------------
-------------------------
1D-array with 3 axes:



array([[[1. , 0.5]]])

-------------------------


- esempio di uno stesso **2D**-array scritto come matrice e tensore:

In [5]:
for nd in range(2, 4):
    print('-------------------------')
    print(f'2D-array with {nd} axes:')
    print('')
    display(np.array([[1., 0.5], [0.5, 1.]], ndmin=nd))
    print('-------------------------')

-------------------------
2D-array with 2 axes:



array([[1. , 0.5],
       [0.5, 1. ]])

-------------------------
-------------------------
2D-array with 3 axes:



array([[[1. , 0.5],
        [0.5, 1. ]]])

-------------------------


- esempio di un **3D**-array scritto come tensore:

In [6]:
print(f'3D-array with {nd} axes:')
print('')
display(np.array([[[1., 0.5], [0.5, 1.]], [[2., 1.5], [1.5, 2.]]]))

3D-array with 3 axes:



array([[[1. , 0.5],
        [0.5, 1. ]],

       [[2. , 1.5],
        [1.5, 2. ]]])

### Altre Funzioni per la Creazione di Array

Di seguito proponiamo una lista di alcune delle principali **funzioni** numpy per la **creazione di array**:
- np.**identity**(n): restituisce la matrice identità $\mathbb{R}^{n\times n}$ (2D-array). Per maggiori informazioni, leggere l'help della funzione (rimuovendo il simbolo di commento nella cella qui sottostante).

In [7]:
# help(np.identity)

- np.**eye**(n,m,k): restituisce la matrice $\mathbb{R}^{n\times m}$ avente tutti elementi nulli tranne quelli di indice $(i, i+k)$, che avranno valore $1$ (cioè la $k$-esima diagonale ha elementi uguali a $1$). L'argomento k può essere omesso (in tal caso assume valore 0 di default). Per maggiori informazioni, leggere l'help della funzione (rimuovendo il simbolo di commento nella cella qui sottostante).

In [8]:
# help(np.eye)

- np.**zeros**( (d1, ..., dN) ): restutuisce l'ND-array nullo nello spazio $\mathbb{R}^{d_1\times\cdots\times d_N}$. Per maggiori informazioni, leggere l'help della funzione (rimuovendo il simbolo di commento nella cella qui sottostante).

In [9]:
# help(np.zeros)

- np.**ones**( (d1, ..., dN) ): restituisce l'ND-array nello spazion $\mathbb{R}^{d_1\times\cdots\times d_N}$, con tutti elementi uguali ad 1. Per maggiori informazioni, leggere l'help della funzione (rimuovendo il simbolo di commento nella cella qui sottostante).

In [10]:
# help(np.ones)

- np.**random.rand**(d1,... ,dN): restituisce l'ND-array in $\mathbb{R}^{d_1\times\cdots\times d_N}$, con tuti elementi campionati casualmente in $[0,1]$ (distribuzione uniforme). Se non si inserisce argomenti, la funzione restituisce un numero scalare (ATTENTIONE, not uno 0D-array!). Per maggiori informazioni, leggere l'help della funzione (rimuovendo il simbolo di commento nella cella qui sottostante).

In [11]:
# help(np.random.rand)

- np.**arange**(n0,nFin,step): è la "versione array" di numpy per generare array analoghi agli oggetti range di python. Questa funzione restituisce un 1D-array con elementi tra **n0** (*incluso*, default 0 se omesso) e **nFin** (escluso), con passo **step** (default 1 se omesso). Per maggiori informazioni, leggere l'help della funzione (rimuovendo il simbolo di commento nella cella qui sottostante).

In [12]:
# help(np.arange)

- np.**linspace**(start, stop, num): restituisce un 1D-array di **num** elementi (default 50 se omesso) equispaziati nell'intervallo [start, stop]. Per maggiori informazioni, leggere l'help della funzione (rimuovendo il simbolo di commento nella cella qui sottostante).

In [13]:
# help(np.linspace)

### Metodi ed Attributi di Array

I principali metodi ed attributi degli oggetti array (di seguito indicati dalla variabile **v**) sono i seguenti:
- v.**shape**: è la tupla (d1, ..., dN) se v è un ND-array in $\mathbb{R}^{d_1\times\cdots\times d_N}$. se v è uno 0D-array, la tupla sarà vuota, cioè (). Nella cella sottostante è possibile vedere alcuni esempi.

In [14]:
v1 = np.array(np.random.rand())  # random 0D-array
v2 = np.random.rand(4)  # random 1D-array of 4 elements
v3 = np.random.rand(3, 4)  # random 2D-array 3-by-4 elements

for v in [v1, v2, v3]:
    print(f'The shape of {v} is {v.shape}')
    print('')

The shape of 0.5748609446550265 is ()

The shape of [0.75871672 0.72189416 0.65614971 0.88202467] is (4,)

The shape of [[0.68395194 0.19472231 0.13709062 0.05123454]
 [0.20657917 0.50097153 0.25775705 0.54348368]
 [0.38395963 0.70841894 0.71563765 0.59150153]] is (3, 4)



- v.**ndim**: è il numero di assi ("dimensioni dell'array") di v; quindi v.ndim è uguale alla lunghezza della tupla v.shape. Nella cella sottostante è possibile vedere alcuni esempi.

In [15]:
for v in [v1, v2, v3]:
    print(f'The ndim of {v} is {v.ndim}')
    print('')

The ndim of 0.5748609446550265 is 0

The ndim of [0.75871672 0.72189416 0.65614971 0.88202467] is 1

The ndim of [[0.68395194 0.19472231 0.13709062 0.05123454]
 [0.20657917 0.50097153 0.25775705 0.54348368]
 [0.38395963 0.70841894 0.71563765 0.59150153]] is 2



- v.**size**: è il numero totale di elementi di v; quindi v.size è uguale al prodotto dei valori della tupla v.shape. Nella cella sottostante è possibile vedere alcuni esempi.

In [16]:
for v in [v1, v2, v3]:
    print(f'The size of {v} is {v.size}')
    print('')

The size of 0.5748609446550265 is 1

The size of [0.75871672 0.72189416 0.65614971 0.88202467] is 4

The size of [[0.68395194 0.19472231 0.13709062 0.05123454]
 [0.20657917 0.50097153 0.25775705 0.54348368]
 [0.38395963 0.70841894 0.71563765 0.59150153]] is 12



- v.**T**: è la trasposta di v (nessun effetto per v se 0D/1D-array). Nella cella sottostante è possibile vedere alcuni esempi.

In [17]:
print(f'This is a matrix:')
print(f'{v3}')
print('')
print(f'This is its transpose:')
print(f'{v3.T}')

This is a matrix:
[[0.68395194 0.19472231 0.13709062 0.05123454]
 [0.20657917 0.50097153 0.25775705 0.54348368]
 [0.38395963 0.70841894 0.71563765 0.59150153]]

This is its transpose:
[[0.68395194 0.20657917 0.38395963]
 [0.19472231 0.50097153 0.70841894]
 [0.13709062 0.25775705 0.71563765]
 [0.05123454 0.54348368 0.59150153]]


- v.**copy**(): restituisce una copia di v. MOLTO IMPORTANTE PER EVITARE ERRORI NEL CODICE! Nella cella sottostante è possibile vedere alcuni esempi.

In [18]:
v1b = v1.copy()

print(f'Do the copies have the same value(s) of the original array? Answer: {v1 == v1b}')
print(f'Do the copies point to the same object in memory of the original array? Answer: {v1 is v1b}')

Do the copies have the same value(s) of the original array? Answer: True
Do the copies point to the same object in memory of the original array? Answer: False


- v.**nonzero**(): restituisce una tupla con N array rappresentanti gli indici $(i, j, \ldots)$ corrispondenti ai valori non nullidi v. Nella cella sottostante è possibile vedere alcuni esempi.

In [19]:
I3 = np.identity(3)

print(f'The nonzero elements of the matrix are: {I3.nonzero()}')
print('')
print('To read "better" the indexes of the nonzero elements:')

num_indexes = len(I3.nonzero()[0])
for n in range(num_indexes):
    idxs = [arr[n] for arr in I3.nonzero()]  # EXERCISE: remember how to use for cycles in 1 line to build sequences!
    print(f'Nonzero element {n + 1}: {tuple(idxs)}')

The nonzero elements of the matrix are: (array([0, 1, 2], dtype=int64), array([0, 1, 2], dtype=int64))

To read "better" the indexes of the nonzero elements:
Nonzero element 1: (0, 0)
Nonzero element 2: (1, 1)
Nonzero element 3: (2, 2)


- v.**reshape**((d1', ..., dM')): restituisce un array in $\mathbb{R}^{d'_1\times\cdots\times d'_M}$ con stessi elementi di v ma "rimodulati" (ATTENZIONE: il nuovo vettore dovrà avere stessa size!). Nella cella sottostante è possibile vedere alcuni esempi.

In [20]:
v3rs = v3.reshape((2, 6))

print(f'Original matrix of shape {v3.shape} (size {v3.size}):')
print(v3)
print('')
print(f'Reshaped matrix of shape {v3rs.shape} (size {v3rs.size}):')
print(v3rs)

Original matrix of shape (3, 4) (size 12):
[[0.68395194 0.19472231 0.13709062 0.05123454]
 [0.20657917 0.50097153 0.25775705 0.54348368]
 [0.38395963 0.70841894 0.71563765 0.59150153]]

Reshaped matrix of shape (2, 6) (size 12):
[[0.68395194 0.19472231 0.13709062 0.05123454 0.20657917 0.50097153]
 [0.25775705 0.54348368 0.38395963 0.70841894 0.71563765 0.59150153]]


- v.**sum**(axis=(ax_i1, ..., ax_im)): restituisce un array ottenuto dalla somma degli elementi di v rispetto l'asse/gli assi selezionata/i, come indicato dalla tupla $(ax_{i_1}, \ldots, ax_{i_m})$. Se nessuna tupla di assi viene indicata, tutti gli elementi di v vengono sommati. Nella cella sottostante è possibile vedere alcuni esempi.

In [21]:
print(f'Sum of v3 "moving along the rows": {v3.sum(axis=0)}')
print(f'Sum of v3 "moving along the columns": {v3.sum(axis=1)}')
print(f'Sum of all the elements in v3: {v3.sum()}')

Sum of v3 "moving along the rows": [1.27449075 1.40411279 1.11048531 1.18621976]
Sum of v3 "moving along the columns": [1.06699942 1.50879144 2.39951775]
Sum of all the elements in v3: 4.975308604867996


- v.**max**(axis=(ax_i1, ..., ax_im)): restituisce un array con gli elementi massimi di v rispetto l'asse/gli assi selezionata/i, come indicato dalla tupla $(ax_{i_1}, \ldots, ax_{i_m})$. Se nessuna tupla di assi viene indicata, il masismo degli elementi di v viene restituito.

#### Altri Metodi
Molti altri metodi esistono e possono essere facilmente studiati/trovati nella documentazione ufficiale di numpy. Alcuni altri metodi base sono, p.e.,  v.**prod**() o v.**min**(), i quali funzionano rispettivamente in maniera analoga a v.sum() e v.max().

#### L'Indicizzazione in Python PARTE DA ZERO!
**Atenzione:** il criterio di indicizzazione usato da python prevede di partire a contare da 0 e non da 1 (come invece fa Matlab, per esempio). 

## Indexing e Slicing per Array
Poiché le sequenze (liste, tuple, 1D-array, ecc.) sono contenitori ordinati di oggetti, i loro elementi sono indicizzati e quindi è possibile definire due operazioni speciali:
- **Indexing:** seleziona elementi singoli della sequenza con il comando **seq[index]**.
- **Slicing:** estrae "porzioni" della sequenza (con sintassi analoga a quella usata per i range), digitando **seq[i0:iFin:step]**. Di default i0 è 0 (se omesso), iFin è la lunghezza della sequenza (se omesso) e step è 1 (se omesso). Il primo simbolo "due punti" deve essere sempre scritto, anche se i0 viene omesso, il secondo non è invece necessario se step viene omesso. ATTENZIONE: come per i range, i0 è INCLUSO e iFin è ESCLUSO!

#### Il Backward Indexing
Data una sequenza generica di $n$ elementi, questi possono essere indicizzati anche "a partire dalla fine", con valori negativi. Quindi, possiamo indicizzare gli elementi invece che con indici da 0 ad $n-1$, con indici da $-n$ a $-1$. Più in generale, abbiamo quindi che un elemento può essere indicizzato sia con $-j$ che $n-j$, dato $j\in\{1, \ldots, n\}$.

### Esempi di Indexing

In [22]:
vseq = np.arange(2, 21, 2)

print(f'Original sequence vseq: {vseq}')
print(f'vseq[0] --> {vseq[0]}')
print(f'vseq[9] --> {vseq[9]}')
print(f'vseq[-1] --> {vseq[-1]}')
print(f'vseq[-10] --> {vseq[-10]}')

Original sequence vseq: [ 2  4  6  8 10 12 14 16 18 20]
vseq[0] --> 2
vseq[9] --> 20
vseq[-1] --> 20
vseq[-10] --> 2


### Esempi di Slicing

In [23]:
print(f'Original sequence vseq: {vseq}')
print(f'vseq[0:6] --> {vseq[0:6]}')
print(f'vseq[:6] --> {vseq[:6]}')
print(f'vseq[0:-4] --> {vseq[0:-4]}')
print(f'vseq[:-4] --> {vseq[:-4]}')
print(f'vseq[-10:-4] --> {vseq[-10:-4]}')
print(f'vseq[-10:6] --> {vseq[-10:6]}')
print(f'vseq[0:6:2] --> {vseq[0:6:2]}')
print(f'vseq[::2] --> {vseq[::2]}')
print(f'vseq[::] --> {vseq[::]}')

Original sequence vseq: [ 2  4  6  8 10 12 14 16 18 20]
vseq[0:6] --> [ 2  4  6  8 10 12]
vseq[:6] --> [ 2  4  6  8 10 12]
vseq[0:-4] --> [ 2  4  6  8 10 12]
vseq[:-4] --> [ 2  4  6  8 10 12]
vseq[-10:-4] --> [ 2  4  6  8 10 12]
vseq[-10:6] --> [ 2  4  6  8 10 12]
vseq[0:6:2] --> [ 2  6 10]
vseq[::2] --> [ 2  6 10 14 18]
vseq[::] --> [ 2  4  6  8 10 12 14 16 18 20]


## Indexing e Slicing Generalizzati a ND-array

Sia v un ND-array con N assi, indicizzati da 0 ad N-1. Allora possiamo eseguire operazioni di indexing e slicing rispetto ognuno degli assi digitando **v[index or slice axis0, ..., index or slice axisN-1]**. Il risultato sarà un "ND-sotto-array" di v. Nella cella sottostante è possibile vedere alcuni esempi.

In [24]:
print('Submatrix of v3 that takes rows 1,3, and columns 2,4:')
print(v3[0::2, 1::2])

Submatrix of v3 that takes rows 1,3, and columns 2,4:
[[0.19472231 0.05123454]
 [0.70841894 0.59150153]]


## Cancellare Righe/Colonne da una Matrice

Per cancellare/eliminare righe o colonne da una matrice si può utilizzare la funzione *np.delete*. Di fatto. la funzione può essere applicata anche ad ND-array, non solo a matrici.
- np.**delete**(array, sequence_of_inds, axis): restituisce un nuovo array ottenuto dall'array iniziale rimuovendo il sotto-array indicato da sequence_of_inds lungo l'asse indicato. In particolare restituisce l'array iniziale dove l'$i$-esimo array dell'asse indicato è stato rimosso, per ogni $i$ in *sequence_of_inds*.

In [25]:
# help(np.delete)  # Uncomment this line to read the help of the function

v3_norow_0_2 = np.delete(v3, [0, 2], axis=0)
v3_nocol_1 = np.delete(v3, 1, axis=1)

print('Removed rows 0 and 2 from v3:')
print(v3_norow_0_2)
print('')
print('Removed column 1 from v3:')
print(v3_nocol_1)

Removed rows 0 and 2 from v3:
[[0.20657917 0.50097153 0.25775705 0.54348368]]

Removed column 1 from v3:
[[0.68395194 0.13709062 0.05123454]
 [0.20657917 0.25775705 0.54348368]
 [0.38395963 0.71563765 0.59150153]]


## Operazioni con gli Array

Tutte le operazioni aritmetiche classiche di python (+, -, $\ *$, /, //, $\%$) sono eseguite sempre **elemento-per-elemento**.

La moltiplicazione tra matrici ed il prodotto scalare tra vettori viene invece eseguito con la funzione np.**matmul**. Per il caso di prodotto tra matrici, si può in alternativa usare il più semplice operatore **@**.

In particolare, per ogni coppia v1, v2 di array (1D o 2D, non consideriamo altri casi), np.matmul funziona nel modo seguente:
- np.**matmul**(v1, v2): restituisce il prodotto matrice-matrice se entrambi 2D-array, altrimenti (entrambi 1D-array) restituisce il prodotto scalare.

**ATTENZIONE:** se dovete moltiplicare una matrice per un vettore (o viceversa), il vettore **dovrà essere per forza un 2D-array** (della dimensione appropriata per fare la moltiplicazione).

Nella cella sottostante è possibile vedere alcuni esempi.

In [26]:
print(f'Scalar product of v2 with itself: {np.matmul(v2, v2)}')
print('')
print(f'Matrix-matrix product of v3 with its transpose:')
print(np.matmul(v3, v3.T))
print('')
print(f'Matrix-matrix product of v3 with its transpose, using the @ operator:')
print(v3 @ v3.T)
print('')
print(f'Matrix-matrix product of v3 with v2 (reshaped as a column vector), using the @ operator:')
print(v3 @ v2.reshape((4, 1)))

Scalar product of v2 with itself: 2.3052821985442473

Matrix-matrix product of v3 with its transpose:
[[0.52712586 0.30202177 0.52896743]
 [0.30202177 0.65546064 0.94014786]
 [0.52896743 0.94014786 1.5112937 ]]

Matrix-matrix product of v3 with its transpose, using the @ operator:
[[0.52712586 0.30202177 0.52896743]
 [0.30202177 0.65546064 0.94014786]
 [0.52896743 0.94014786 1.5112937 ]]

Matrix-matrix product of v3 with v2 (reshaped as a column vector), using the @ operator:
[[0.79463677]
 [1.16687672]
 [1.79400447]]
