<a href="https://colab.research.google.com/github/emamanni/AnalisiDeiDati24-25/blob/main/04_LaLibreriaNumPy.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Python for Data Science hands-on review: la libreria NumPy

NumPy (abbreviazione di *Numerical Python*) fornisce un'interfaccia efficiente per memorizzare e operare su buffer di dati densi.

In un certo senso, gli array NumPy sono come il tipo `list` incorporato in Python, ma gli array NumPy forniscono una memorizzazione e operazioni sui dati molto più efficienti man mano che le dimensioni degli array aumentano.

Gli array NumPy costituiscono il nucleo di quasi tutto l'ecosistema di strumenti per la data science in Python.

Una volta installato (se non già presente), si può importare NumPy e controllare la versione ...

In [None]:
import numpy
numpy.__version__

'1.26.4'

Per convenzione, tipicamente si importa NumPy usando `np` come alias ...

In [None]:
import numpy as np

##Creazione di array a partire da liste

Per creare un array a partire da una lista:

In [None]:
# Array di interi
np.array([1, 4, 2, 5, 3])

array([1, 4, 2, 5, 3])

Si tenga presente che, a differenza delle liste Python, gli array NumPy possono contenere solo dati dello stesso tipo. Se i tipi non corrispondono, NumPy esegue l'upcast in base alle sue regole di "type promotion". Nel caso seguente, i numeri interi sono stati trasformati in virgola mobile:

In [None]:
np.array([3.14, 4, 2, 3])

array([3.14, 4.  , 2.  , 3.  ])

Per impostare esplicitamente il tipo di dati dell'array risultante, si può usare la parola chiave `dtype`:

In [None]:
np.array([1, 2, 3, 4], dtype=np.float32)

array([1., 2., 3., 4.], dtype=float32)

Infine, a differenza delle liste di Python, che sono sempre sequenze monodimensionali, gli array di NumPy possono essere multidimensionali. Di seguito un modo per inizializzare un array multidimensionale utilizzando un elenco di liste. Le liste interne sono trattate come righe dell'array bidimensionale risultante.

In [None]:
# Array multidimensionale a partire da liste innestate
np.array([range(i, i + 3) for i in [2, 4, 10]])

array([[ 2,  3,  4],
       [ 4,  5,  6],
       [10, 11, 12]])

##Creazione di array da zero

Soprattutto per gli array più grandi, è più efficiente creare gli array da zero utilizzando le routine integrate in NumPy.

In [None]:
# Creare un array di interi di lunghezza 10 pieno di 0
np.zeros(10, dtype=int)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

In [None]:
# Creare un array 3x5 in virgola mobile pieno di 1
np.ones((3, 5), dtype=float)

array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]])

In [None]:
# Creare un array 3x5 riempito con 3.14
np.full((3, 5), 3.14)

array([[3.14, 3.14, 3.14, 3.14, 3.14],
       [3.14, 3.14, 3.14, 3.14, 3.14],
       [3.14, 3.14, 3.14, 3.14, 3.14]])

In [None]:
# Creare un array riempito con una sequenza lineare
# iniziando da 0, finendo a 20, con un passo di 2
# (è simile alla funzione range)
np.arange(0, 20, 2)

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18])

In [None]:
# Creare un array di cinque valori equamente distanziati tra 0 e 1
np.linspace(0, 1, 5)

array([0.  , 0.25, 0.5 , 0.75, 1.  ])

In [None]:
# Creare una matrice 3x3 di valori pseudo-casuali
# uniformemente distribuiti tra 0 e 1
np.random.random((3, 3))

array([[0.64577078, 0.99700029, 0.38455567],
       [0.8767605 , 0.06340225, 0.54183091],
       [0.17166936, 0.74371236, 0.48626662]])

In [None]:
# Creare una matrice identità 3x3
np.eye(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

In [None]:
# Crea un array non inizializzato di tre numeri interi; i valori saranno
# ciò che è presente in quella posizione di memoria
np.empty(3)

array([1., 1., 1.])

##Manipolazione degli array NumPy

La manipolazione dei dati in Python è quasi sinonimo di manipolazione di array NumPy. Nelle sezioni successive si fornirannole basi per la manipolazione degli array NumPy per accedere ai dati e ai subarray, nonché per dividere, rimodellare e unire gli array.

###Attributi degli array NumPy

Ogni array ha degli attributi, tra cui `ndim` (il numero di dimensioni), `shape` (la dimensione di ogni dimensione), `size` (la dimensione totale dell'array) e `dtype` (il tipo di ogni elemento).

In [None]:
x = np.random.random((3, 3))

print("x ndim: ", x.ndim)
print("x shape:", x.shape)
print("x size: ", x.size)
print("dtype:   ", x.dtype)

x ndim:  2
x shape: (3, 3)
x size:  9
dtype:    float64


###Indicizzazione di un array: accedere ad un elemento singolo

In un array monodimensionale, si può accedere al valore i-esimo (contando da zero) specificando l'indice desiderato tra parentesi quadre, proprio come avviene con le liste Python.

In [None]:
x1 = np.arange(0, 20, 2)
x1

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18])

In [None]:
x1[0]

0

In [None]:
x1[6]

12

Per considerare gli indici a partire dalla fine di un array, occorre considerare valori negativi.

In [None]:
x1[-1]

18

In [None]:
x1[-4]

12

In un array multidimensionale, si può accedere ad un elemento utilizzando una tupla (riga, colonna).

In [None]:
x

array([[0.07036125, 0.19617353, 0.63285949],
       [0.05950769, 0.95026948, 0.58927738],
       [0.59644454, 0.80391087, 0.64042185]])

In [None]:
x[0,0]

0.0703612530145582

In [None]:
x[2,0]

0.5964445379035209

In [None]:
x[2,-1]

0.6404218531642767

È possibile modificare dei valori utilizzando gli indici.

In [None]:
x[0,0] = 0.45
x

array([[0.45      , 0.19617353, 0.63285949],
       [0.05950769, 0.95026948, 0.58927738],
       [0.59644454, 0.80391087, 0.64042185]])

Si ricordi che il tipo dei dati contenuti in un array è fisso. Pertanto, se nell'array `x` precedente si proverà ad inserire un valore intero, esso sarà convertito nel corrispondente valore in virgola mobile.

In [None]:
x[0,1] = 7
x

array([[0.45      , 7.        , 0.63285949],
       [0.05950769, 0.95026948, 0.58927738],
       [0.59644454, 0.80391087, 0.64042185]])

###Slicing di un array: accedere a sotto-array

Così come si possono usare le parentesi quadre per accedere ai singoli elementi di un array, si possono anche usarle per accedere a sotto-array con la notazione slice, contrassegnata dai due punti (:). La sintassi di NumPy per accedere a uno slice di un array `x`, è:

`x[start:stop:step]`

Se uno qualsiasi di questi valori non è specificato, i valori di default sono `start=0`, `stop=<numero di dimensioni>`, `step=1`.

####Sotto-array ad una dimensione

In [None]:
x1

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18])

In [None]:
x1[:3]  # primi tre elementi

array([0, 2, 4])

In [None]:
x1[3:]  # elementi dall'indice 3 in poi

array([ 6,  8, 10, 12, 14, 16, 18])

In [None]:
x1[1:4]  # sotto-array centrale

array([2, 4, 6])

In [None]:
x1[::2]  # ogni 2 elementi, a partire dall'inizio

array([ 0,  4,  8, 12, 16])

In [None]:
x1[1::2]  # ogni 2 elementi, a partire dall'indice 1

array([ 2,  6, 10, 14, 18])

Quando il valore di `step` è negativo, i valori predefiniti di `start` e `stop` vengono scambiati. Questo diventa un modo conveniente per invertire un array.

In [None]:
x1[::-1]  # tutti gli elementi, in ordine inverso

array([18, 16, 14, 12, 10,  8,  6,  4,  2,  0])

In [None]:
x1[4::-2]  # ogni 2 elementi, a partire dall'indice 4, in ordine inverso

array([8, 4, 0])

####Sottoarray-multidimensionali
Il funzionamento è analogo, con slice multipli separati da virgole.

In [None]:
x

array([[0.45      , 7.        , 0.63285949],
       [0.05950769, 0.95026948, 0.58927738],
       [0.59644454, 0.80391087, 0.64042185]])

In [None]:
x[:2, :2]  # prime 2 righe e prime 2 colonne

array([[0.45      , 7.        ],
       [0.05950769, 0.95026948]])

In [None]:
x[:3, ::2]  # prime 3 righe, ogni 2 colonne

array([[0.45      , 0.63285949],
       [0.05950769, 0.58927738],
       [0.59644454, 0.64042185]])

In [None]:
x[::-1, ::-1]  # tutte le righe e le colonne, in ordine inverso

array([[0.64042185, 0.80391087, 0.59644454],
       [0.58927738, 0.95026948, 0.05950769],
       [0.63285949, 7.        , 0.45      ]])

####Accedere a righe e colonne di un array multidimensionale
Una pratica frequentemente utilizzata è l'accesso a singole righe o colonne di un array. Questo può essere fatto combinando l'indicizzazione e lo slicing, utilizzando uno slice vuoto contrassegnato da un singolo `:`

In [None]:
x[:, 0]  # prima colonna

array([0.45      , 0.05950769, 0.59644454])

In [None]:
x[0, :]  # prima riga

array([0.45      , 7.        , 0.63285949])

Nel caso di accesso ad una riga, lo slice vuoto può essere omesso per ottenere una sintassi più compatta.

In [None]:
x[0]  # equivalente a x[0, :]

array([0.45      , 7.        , 0.63285949])

###Sotto-array come viste
A differenza degli slice di liste Python, gli slice di array NumPy sono restituiti come viste piuttosto che come copie dei dati dell'array. Consideriamo il l'array bidimensionale precedente.

In [None]:
print(x)

[[0.45       7.         0.63285949]
 [0.05950769 0.95026948 0.58927738]
 [0.59644454 0.80391087 0.64042185]]


Estraiamo un sotto-array 2x2.

In [None]:
x_sub = x[:2, :2]
print(x_sub)

[[0.45       7.        ]
 [0.05950769 0.95026948]]


Ora, se modifichiamo questo sotto-array, vedremo che l'array originale è cambiato!

In [None]:
x_sub[0, 0] = 10
print(x_sub)

[[10.          7.        ]
 [ 0.05950769  0.95026948]]


In [None]:
print(x)

[[10.          7.          0.63285949]
 [ 0.05950769  0.95026948  0.58927738]
 [ 0.59644454  0.80391087  0.64042185]]


###Creare copie di un array
A volte è utile copiare esplicitamente i dati all'interno di un array o di un sotto-array. Questo può essere fatto con il metodo `copy`.

In [None]:
x_sub_copy = x[:2, :2].copy()
print(x_sub_copy)

[[10.          7.        ]
 [ 0.05950769  0.95026948]]


Se ora modifichiamo questo sotto-array, l'array originale rimane invariato.

In [None]:
x_sub_copy[0, 0] = 18.44
print(x_sub_copy)

[[18.44        7.        ]
 [ 0.05950769  0.95026948]]


In [None]:
print(x)

[[10.          7.          0.63285949]
 [ 0.05950769  0.95026948  0.58927738]
 [ 0.59644454  0.80391087  0.64042185]]


###Concatenazione e separazione di array
NumPy fornisce anche strumenti per combinare più array in uno solo e per dividere un singolo array in più array.
####Concatenazione di array
La concatenazione, o l'unione di due array in NumPy, si realizza principalmente con le routine `np.concatenate`, `np.vstack` e `np.hstack`. `np.concatenate` prende come primo parametro una tupla o un elenco di array.

In [None]:
a = np.array([1, 2, 3])
b = np.array([30, 20, 10])
np.concatenate([a, b])

array([ 1,  2,  3, 30, 20, 10])

Si possono concatenare anche più di due array.

In [None]:
c = np.array([5, 6, 7])
print(np.concatenate([a, b, c]))

[ 1  2  3 30 20 10  5  6  7]


Concatenare array bidimensionali.

In [None]:
array1 = np.array([[1, 2, 3], [4, 5, 6]])
array2 = np.array([[7, 8, 9], [10, 11, 12]])

In [None]:
# concatenazione lungo il primo asse
np.concatenate([array1, array2])

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])

In [None]:
# concatenazione lungo il secondo asse (l'indicizzazione parte da 0)
np.concatenate([array1, array2], axis=1)

array([[ 1,  2,  3,  7,  8,  9],
       [ 4,  5,  6, 10, 11, 12]])

Per array di dimensioni miste, è conveniente usare le funzioni `np.vstack` (stack verticale) e `np.hstack` (stack orizzontale)

In [None]:
# impila verticalmente gli array
np.vstack([x, array1])

array([[10.        ,  7.        ,  0.63285949],
       [ 0.05950769,  0.95026948,  0.58927738],
       [ 0.59644454,  0.80391087,  0.64042185],
       [ 1.        ,  2.        ,  3.        ],
       [ 4.        ,  5.        ,  6.        ]])

In [None]:
# impila orizzontalmente gli array
y = np.array([[99],
              [99]])
np.hstack([array1, y])

array([[ 1,  2,  3, 99],
       [ 4,  5,  6, 99]])

####Separazione di array
L'opposto della concatenazione è la separazione, implementata dalle funzioni `np.split`, `np.hsplit` e `np.vsplit`. Per ciascuna di esse è possibile passare un elenco di indici che indicano i punti di divisione.

In [None]:
x = [1, 2, 3, 99, 99, 3, 2, 1]
x1, x2, x3 = np.split(x, [3, 5])
x4, x5 =  np.split(x, [3])
print(x1, x2, x3)
print(x4, x5)

[1 2 3] [99 99] [3 2 1]
[1 2 3] [99 99  3  2  1]


In [None]:
h = np.array([[ 0,  1,  2,  3],
 [ 4,  5,  6,  7],
  [ 8,  9, 10, 11],
   [12, 13, 14, 15]])
h

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])

In [None]:
upper, lower = np.vsplit(h, [2])
print(upper)
print(lower)

[[0 1 2 3]
 [4 5 6 7]]
[[ 8  9 10 11]
 [12 13 14 15]]


In [None]:
left, right = np.hsplit(h, [2])
print(left)
print(right)

[[ 0  1]
 [ 4  5]
 [ 8  9]
 [12 13]]
[[ 2  3]
 [ 6  7]
 [10 11]
 [14 15]]


##Eseguire calcoli su array NumPy: le Universal Functions (`ufuncs`)
Eseguire calcoli sugli array di NumPy può essere molto veloce o molto lento. La chiave per rendere queste operazioni veloci è l'uso di operazioni vettoriali, generalmente implementate attraverso le funzioni universali di NumPy (ufuncs).

###Introduzione alle Ufuncs
Per molti tipi di operazioni, NumPy fornisce una comoda interfaccia, nota come operazione vettoriale. Per operazioni semplici come la divisione elementare, la vettorizzazione è semplice come usare gli operatori aritmetici Python direttamente sull'oggetto array. L'approccio vettoriale è stato progettato per spingere il ciclo nel livello compilato che sta alla base di NumPy, rendendo l'esecuzione molto più veloce.

Le operazioni vettoriali in NumPy sono implementate tramite ufuncs, il cui scopo principale è quello di eseguire rapidamente operazioni ripetute sui valori degli array NumPy.

Ad esempio, su un array monodimensionale:

In [None]:
values = np.array([9, 4, 1, 3, 8])
print(values)

[9 4 1 3 8]


In [None]:
print(1.0 / values)

[0.11111111 0.25       1.         0.33333333 0.125     ]


Si può anche operare tra 2 array:

In [None]:
np.arange(5) / np.arange(1, 6)

array([0.        , 0.5       , 0.66666667, 0.75      , 0.8       ])

Le operazioni ufunc non sono limitate agli array monodimensionali. Possono agire anche su array multidimensionali:

In [None]:
x = np.array([[1, 2], [3, 4]])
2 ** x

array([[ 2,  4],
       [ 8, 16]])

###Le diverse tipologie di Ufuncs
Le Ufuncs esistono in due varianti: ufuncs unarie, che operano su un singolo input, e ufuncs binarie, che operano su due input.

####Operazioni aritmetiche sugli array
È possibile utilizzare le normali operazioni di addizione, sottrazione, moltiplicazione e divisione:

In [None]:
x = np.arange(4)
print("x      =", x)
print("x + 5  =", x + 5)
print("x - 5  =", x - 5)
print("x * 2  =", x * 2)
print("x / 2  =", x / 2)
print("x // 2 =", x // 2)   # floor division: Questo operatore divide il primo
                            # argomento per il secondo e arrotonda il risultato
                            # al numero intero più vicino

x      = [0 1 2 3]
x + 5  = [5 6 7 8]
x - 5  = [-5 -4 -3 -2]
x * 2  = [0 2 4 6]
x / 2  = [0.  0.5 1.  1.5]
x // 2 = [0 0 1 1]


Esiste anche una ufunc unaria per la negazione, un operatore `**` per l'elevamento a potenza e un operatore `%` per il modulo:

In [None]:
print("-x     = ", -x)
print("x ** 2 = ", x ** 2)
print("x % 2  = ", x % 2)

-x     =  [ 0 -1 -2 -3]
x ** 2 =  [0 1 4 9]
x % 2  =  [0 1 0 1]


Inoltre, queste possono essere collegate tra loro nel modo desiderato, rispettando l'ordine standard delle operazioni:

In [None]:
print(-(0.5*x + 1) ** 2)

[-1.   -2.25 -4.   -6.25]


Tutte queste operazioni aritmetiche sono semplicemente dei comodi wrapper attorno a specifiche ufunc integrate in NumPy. Ad esempio, l'operatore + è un wrapper per l'ufunc `add`:

In [None]:
np.add(x, 2)

array([2, 3, 4, 5])

La seguente tabella elenca gli operatori aritmetici implementati in NumPy:

| Operatore    | Ufunc corrispondente  | Descrizione                         |
|-------------|-------------------|-------------------------------------|
|`+`          |`np.add`           |Addizione (es., `1 + 1 = 2`)         |
|`-`          |`np.subtract`      |Sottrazione (es., `3 - 2 = 1`)      |
|`-`          |`np.negative`      |Negazione unaria (es., `-2`)          |
|`*`          |`np.multiply`      |Moltiplicazione (es., `2 * 3 = 6`)   |
|`/`          |`np.divide`        |Divisione (es., `3 / 2 = 1.5`)       |
|`//`         |`np.floor_divide`  |Divisione con arrotondamento (es., `3 // 2 = 1`)  |
|`**`         |`np.power`         |Elevamento a potenza (es., `2 ** 3 = 8`)  |
|`%`          |`np.mod`           |Modulo/resto (es., `9 % 4 = 1`)|

####Valore assoluto
Con NumPy è possibile anche utilizzare la funzione valore assoluto integrata in Python:

In [None]:
x = np.array([-2, -1, 0, 1, 2])
abs(x)

array([2, 1, 0, 1, 2])

La corrispondentu ufunc di NumPy è `np.absolute` (è possibile anche utilizzare l'alias `np.abs`):

In [None]:
np.absolute(x)

array([2, 1, 0, 1, 2])

In [None]:
np.abs(x)

array([2, 1, 0, 1, 2])

####Funzioni trigonometriche
Altre ufunc molto utili sono quelle relative a funzioni trigonometriche.

Definiamo innanzitutto un array di angoli:

In [None]:
theta = np.linspace(0, np.pi, 3)

Applichiamo alcune funzioni trigonometriche:

In [None]:
print("theta      = ", theta)
print("sin(theta) = ", np.sin(theta))
print("cos(theta) = ", np.cos(theta))
print("tan(theta) = ", np.tan(theta))

theta      =  [0.         1.57079633 3.14159265]
sin(theta) =  [0.0000000e+00 1.0000000e+00 1.2246468e-16]
cos(theta) =  [ 1.000000e+00  6.123234e-17 -1.000000e+00]
tan(theta) =  [ 0.00000000e+00  1.63312394e+16 -1.22464680e-16]


I valori sono calcolati con la precisione della macchina, per cui i valori che dovrebbero essere zero non sempre corrispondono esattamente a zero. Sono disponibili anche funzioni trigonometriche inverse:

In [None]:
x = [-1, 0, 1]
print("x         = ", x)
print("arcsin(x) = ", np.arcsin(x))
print("arccos(x) = ", np.arccos(x))
print("arctan(x) = ", np.arctan(x))

x         =  [-1, 0, 1]
arcsin(x) =  [-1.57079633  0.          1.57079633]
arccos(x) =  [3.14159265 1.57079633 0.        ]
arctan(x) =  [-0.78539816  0.          0.78539816]


####Esponenziali e logaritmi
Tra le ufunc NumPy sono presenti anche quelle relative ad esponenziali e logaritmi (sia logaritmo naturale, che in base 2, che in base 10):

In [None]:
x = [1, 2, 3]
print("x   =", x)
print("e^x =", np.exp(x))
print("2^x =", np.exp2(x))
print("3^x =", np.power(3., x))

x   = [1, 2, 3]
e^x = [ 2.71828183  7.3890561  20.08553692]
2^x = [2. 4. 8.]
3^x = [ 3.  9. 27.]


In [None]:
x = [1, 2, 4, 10]
print("x        =", x)
print("ln(x)    =", np.log(x))
print("log2(x)  =", np.log2(x))
print("log10(x) =", np.log10(x))

x        = [1, 2, 4, 10]
ln(x)    = [0.         0.69314718 1.38629436 2.30258509]
log2(x)  = [0.         1.         2.         3.32192809]
log10(x) = [0.         0.30103    0.60205999 1.        ]


##Funzioni di aggregazione
Un primo passo nell'esplorazione di qualsiasi dataset è spesso il calcolo di statistiche di sintesi. Forse le statistiche di riepilogo più comuni sono la media e la deviazione standard, che consentono di riassumere i valori “tipici” di un dataset, ma sono utili anche altre aggregazioni (la somma, il prodotto, la mediana, il minimo e il massimo, i quantili, ecc.)

NumPy dispone di varie funzioni di aggregazione integrate per lavorare sugli array.

###Sommare i valori di un array
Una prima funzione è per il calcolo della somma degli elementi di un array. Si può utilizzare anche la funzione integrata `sum` di Python ma, per array di grandi dimensioni, la funzione `sum` di NumPy è molto più efficiente (come si evince dall'esempio seguente in cui è utilizzata `timeit`, una libreria integrata di Python per misurare il tempo di esecuzione di snippet di codice).

In [None]:
rng = np.random.default_rng()
big_array = rng.random(1000000)
%timeit sum(big_array)
%timeit np.sum(big_array)

366 ms ± 94.3 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
792 µs ± 323 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


###Minimo e massimo
Per calcolare il minimo e massimo valore tra gli elementi di un array è possibile utilizzare:

In [None]:
np.min(big_array), np.max(big_array)

(8.388180428031689e-08, 0.9999993152908462)

Alternativamente, una sintassi più concisa prevede di utilizzare i metodi dell'array stesso (ciò vale anche per la somma):

In [None]:
print(big_array.min(), big_array.max(), big_array.sum())

8.388180428031689e-08 0.9999993152908462 500666.8413135172


###Altre funzioni di aggregazione
La seguente tabella fornisce un elenco di utili funzioni di aggregazione disponibili in NumPy.

|Nome    |   Versione NaN-safe| Descrizione                                   |
|-----------------|-------------------|-----------------------------------------------|
| `np.sum`        | `np.nansum`       | Somma degli elementi                       |
| `np.prod`       | `np.nanprod`      | Prodotto degli elementi                    |
| `np.mean`       | `np.nanmean`      | Media degli elementi                       |
| `np.std`        | `np.nanstd`       | Deviazione standard                    |
| `np.var`        | `np.nanvar`       | Varianza                              |
| `np.min`        | `np.nanmin`       | Trova il minimo valore                            |
| `np.max`        | `np.nanmax`       | Trova il massimo valore                            |
| `np.argmin`     | `np.nanargmin`    | Trova l'indice del minimo valore                   |
| `np.argmax`     | `np.nanargmax`    | Trova l'indice del massimo valore                   |
| `np.median`     | `np.nanmedian`    | Calcola la mediana degli elementi                    |
| `np.percentile` | `np.nanpercentile`| Calcola i percentili     |
| `np.any`        | N/A               | Valuta se un qualsiasi elemento è vero        |
| `np.all`        | N/A               | Valuta se tutti gli elementi sono veri        |


###Operatori di confronto
NumPy implementa anche operatori di confronto come < (minore di) e > (maggiore di) come ufunc che operano elemento per elemento. Il risultato di questi operatori di confronto è sempre un array di tipo booleano. Sono disponibili tutte e sei le operazioni di confronto standard.

In [None]:
x = np.array([1, 2, 3, 4, 5])

In [None]:
x < 3 # minore di

array([ True,  True, False, False, False])

In [None]:
x > 3 # maggiore di

array([False, False, False,  True,  True])

In [None]:
x <= 3 # minore o uguale di

array([ True,  True,  True, False, False])

In [None]:
x >= 3 # maggiore o uguale di

array([False, False,  True,  True,  True])

In [None]:
x != 3 # diverso da

array([ True,  True, False,  True,  True])

In [None]:
x == 3 # uguale a

array([False, False,  True, False, False])

È anche possibile eseguire un confronto elemento per elemento tra due array e includere espressioni composte:

In [None]:
(2 * x) == (x ** 2)

array([False,  True, False, False, False])

Come nel caso degli operatori aritmetici, anche gli operatori di confronto sono implementati come ufunc in NumPy; ad esempio, quando si scrive `x < 3`, internamente NumPy utilizza `np.less(x, 3)`. Qui è riportato un riepilogo degli operatori di confronto e dello loro ufunc equivalenti:

| Operatore    | ufunc equivalente | Operatore   | ufunc equivalente|
|-------------|-------------------|------------|------------------|
|`==`         |`np.equal`         |`!=`        |`np.not_equal`    |
|`<`          |`np.less`          |`<=`        |`np.less_equal`   |
|`>`          |`np.greater`       |`>=`        |`np.greater_equal`|

###Lavorare con array booleani
Dato un array booleano, è possibile eseguire una serie di operazioni utili. Facciamo riferimento all'array bidimensionale `x`:

In [None]:
x = np.array([[9,4,0,3], [2,5,7,3], [9,9,4,0]])
print(x)

[[9 4 0 3]
 [2 5 7 3]
 [9 9 4 0]]


####Contare il numero di elementi
Per contare il numero di elementi `True` in un array booleano, è utile `np.count_nonzero`:

In [None]:
# quanti elementi sono minori di 6?
np.count_nonzero(x < 6)

8

Un modo alternativo è utilizzare `np.sum`; in questo caso `False` è interpretato come `0`, mentre `True` è interpretato come `1`:

In [None]:
np.sum(x < 6)

8

Il vantaggio di `np.sum` è che, come per altre funzioni di aggregazione di NumPy, questa somma può essere fatta anche lungo le righe o le colonne. Ad esempio, lo snippet seguente conta il numero di elementi minori di 6 su ciascuna riga:

In [None]:
# quanti elementi sono minori di 6 su ciascuna riga?
np.sum(x < 6, axis=1)

array([3, 3, 2])

####Operatori booleani
Supponiamo di voler contare il numero di elementi che verifica contemporaneamente due condizioni. Questo tipo di operazione può essere ottenuta con gli operatori logici di Python che operano bit a bit, ovvero `&`, `|`, `^` e `~` (and, or, or esclusivo e not, rispettivamente), o con le corrispondenti ufunc di NumPy. Ad esempio, per contare quanti elementi sono contemporaneamente minori di 6 e pari:

In [None]:
# quanti elementi sono contemporaneamente minori di 6 e pari?
np.sum((x < 6) & (x % 2 == 0))

5

La tabella seguente riassume gli operatori logici booleani e le corrispondenti ufunc:

| Operatore    | ufunc equivalente  | Operatore    | ufunc equivalente |
|-------------|-------------------|-------------|-------------------|
|`&`          |`np.bitwise_and`   |&#124;       |`np.bitwise_or`    |
|`^`          |`np.bitwise_xor`   |`~`          |`np.bitwise_not`   |

###Array booleani come "maschere" (masks)
Prima abbiamo calcolato dei valori aggregati direttamente su array booleani interi. Un modello più potente è quello di usare gli array booleani come maschere, per selezionare particolari sottoinsiemi dei dati stessi.

Con riferimento al precedente array `x`, si è visto che è possibile ottenere facilmente un array con valori `True` o `False`, a seconda che una certa condizione sia verificata o meno. Ad esempio:

In [None]:
x < 6

array([[False,  True,  True,  True],
       [ True,  True, False,  True],
       [False, False,  True,  True]])

Per selezionare solo i valori dell'array che soddisfano la condizione data, si può procedere effettuando un'operazione nota come *masking*:

In [None]:
x[x < 6]

array([4, 0, 3, 2, 5, 3, 4, 0])

Ciò che viene restituito è un array monodimensionale con tutti i valori che soddisfano la condizione, ovvero solo i valori nelle posizioni in cui l'array mask contiene `True`.

##Ordinamento (sorting) di array
Python dispone di alcune funzioni e metodi integrati per ordinare liste e altri oggetti iterabili. La funzione `sorted` prende in input una lista e ne restituisce una copia ordinata. Ad esempio:

In [None]:
lista = [3, 1, 4, 1, 5, 9, 2, 6]
sorted(lista)  # restituisce una copia ordinata

[1, 1, 2, 3, 4, 5, 6, 9]

Per contro, il metodo `sort` agisce direttamente sulla lista da ordinare:

In [None]:
print(lista)
lista.sort()
print(lista)

[3, 1, 4, 1, 5, 9, 2, 6]
[1, 1, 2, 3, 4, 5, 6, 9]


###Ordinamento con NumPy
La funzione `np.sort` è analoga a `sorted`, restituendo una copia dell'array:

In [None]:
x = np.array([2, 1, 4, 3, 5])
np.sort(x)

array([1, 2, 3, 4, 5])

Per effettuare l'ordinamento direttamente sull'array:

In [None]:
print(x)
x.sort()
print(x)

[2 1 4 3 5]
[1 2 3 4 5]


Se so vogliono ottenere gli indici degli elementi ordinati, si utilizza la funzione `argsort`:

In [None]:
x = np.array([2, 1, 4, 3, 5])
i = np.argsort(x)
print(i)

[1 0 3 2 4]


Il primo elemento dell'array restituito contiene l'indice dell'elemento più piccolo, il secondo elemento contiene l'indice del secondo più piccolo e così via.

####Ordinamento lungo le righe o lungo le colonne
Una caratteristica utile degli algoritmi di ordinamento di NumPy è la possibilità di ordinare lungo specifiche righe o colonne di un array multidimensionale utilizzando l'argomento `axis`.

In [None]:
x = np.array([[9,4,0,3], [2,5,7,3], [9,9,4,0]])
print(x)

[[9 4 0 3]
 [2 5 7 3]
 [9 9 4 0]]


In [None]:
# ordinamento di ciascuna colonna di x
np.sort(x, axis=0)

array([[2, 4, 0, 0],
       [9, 5, 4, 3],
       [9, 9, 7, 3]])

In [None]:
# ordinamento di ciascuna riga di x
np.sort(x, axis=1)

array([[0, 3, 4, 9],
       [2, 3, 5, 7],
       [0, 4, 9, 9]])