(numpy_ndarray_notebook)=
# Gli array nel modulo NumPy

NumPy (Numerical Python) è un modulo che estende Python con strutture dati e metodi utili per il calcolo scientifico. Python mette a disposizione oggetti numerici come interi, floating point, ecc. e *containers*, come liste e dizionari. 

Numpy aggiunge una modalità naturale per l'utilizzo di array multidimensionali, una serie di funzioni matematiche di base e la possibilità di generare numeri casuali. Un punto importante è che, mentre in Python una lista può contenere dati di tipi diversi all'interno di un singolo elenco, tutti gli elementi in un array NumPy sono omogenei (o solo numeri o solo stringhe).

L'array è la struttura dati centrale della libreria NumPy. Un array è una griglia di elementi che possono essere indicizzati in vari modi. Gli elementi sono tutti dello stesso tipo, denominato array `dtype`.

È possibile inizializzare gli array NumPy usando liste Python. Per esempio, possiamo creare un array 1-D nel modo seguente:

In [1]:
import numpy as np

a = np.array([1, 2, 3, 4, 5, 6])
print(a)

[1 2 3 4 5 6]


Un array 2-D si crea nel modo seguente:

In [14]:
a = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
print(a)

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]


È possibile creare un array 1-D con la funzione `.arange`:

In [5]:
print(np.arange(2, 9, 2))

[2 4 6 8]


Solitamente si usa `.arange` per incrementi unitari:

In [7]:
x = np.arange(11)
print(x)

[ 0  1  2  3  4  5  6  7  8  9 10]


Un'altra funzione molto utile è `.linspace`:

In [11]:
x = np.linspace(0, 10, num=20)
print(x)

[ 0.          0.52631579  1.05263158  1.57894737  2.10526316  2.63157895
  3.15789474  3.68421053  4.21052632  4.73684211  5.26315789  5.78947368
  6.31578947  6.84210526  7.36842105  7.89473684  8.42105263  8.94736842
  9.47368421 10.        ]


Fissati gli estremi (qui 0, 10) e il numero di elementi desiderati, `.linspace` si occupa di determinare in maniera automatica l'incremento.

## Dimensioni dell'array

Le dimensioni dell'array sono chiamate "assi". L'array `a` ha due assi:

In [17]:
print(a)

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]


In [18]:
a.ndim

2

Ci sono 3 array di 4 elementi ciascuno:

In [19]:
a.shape

(3, 4)

Ricordando che in Python gli indici inziano da 0, il primo elemento dell'array `a` è

In [20]:
print(a[0])

[1 2 3 4]


Gli indici funzionano come ci possiamo aspettare, ricordando che il primo indice fa riferimento alla lista di array e il secondo indice agli elementi all'interno di ciascun array:

In [25]:
a[1:3, 1:3]

array([[ 6,  7],
       [10, 11]])

Per array 1-D

In [26]:
x

array([ 0.        ,  0.52631579,  1.05263158,  1.57894737,  2.10526316,
        2.63157895,  3.15789474,  3.68421053,  4.21052632,  4.73684211,
        5.26315789,  5.78947368,  6.31578947,  6.84210526,  7.36842105,
        7.89473684,  8.42105263,  8.94736842,  9.47368421, 10.        ])

In [28]:
x[0:5]

array([0.        , 0.52631579, 1.05263158, 1.57894737, 2.10526316])

## Operazioni sugli array

Possiamo applicare le normali operazioni aritmetiche sugli array *elemento per elemento*.

In [31]:
x = a[0]
print(x)

[1 2 3 4]


In [32]:
y = a[1]
print(y)

[5 6 7 8]


In [34]:
z = x + y
print(z)

[ 6  8 10 12]


In [35]:
print(x * y)

[ 5 12 21 32]


In [36]:
print(x / y)

[0.2        0.33333333 0.42857143 0.5       ]


## Broadcasting

È possibile eseguire un'operazione tra un array e un singolo numero (chiamata anche operazione tra un vettore e uno scalare) o tra array di due dimensioni diverse. Ad esempio

In [37]:
print(a)

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]


In [38]:
print(2 * a)

[[ 2  4  6  8]
 [10 12 14 16]
 [18 20 22 24]]


NumPy capisce che la moltiplicazione deve essere eseguita in ogni cella. Questo concetto si chiama *broadcasting*.

## Altre operazioni sugli array 

Questa sezione copre massimo, minimo, somma, media, prodotto, deviazione standard e altro

NumPy esegue anche funzioni di aggregazione. Oltre a `min`, `max` e `sum`, è possibile usare `mean` per la media, `prod` per la produttoria, `std` per ottenere la deviazione standard e altro ancora.

In [40]:
x = np.array([1, 2, 3])
print(x)

[1 2 3]


<function ndarray.min>

In [50]:
print([x.min(), x.max(), x.sum(), x.mean(), x.std()])

[1, 3, 6, 2.0, 0.816496580927726]


## Lavorare con formule matematiche

La facilità di implementare delle formule matematiche sugli array è una delle ragioni che rendono NumPy così popolare nella comunità scientifica che utilizza Python.

Ad esempio, questa è la formula della deviazione standard:

$$
s = \sqrt{\sum_{i=1}^n\frac{(x_i - \bar{x})^2}{n}}
$$

La possiamo implementare su un array NumPy nel modo seguente:

In [57]:
np.sqrt(np.sum((x - np.mean(x))**2) / np.size(x))

0.816496580927726

Questa implementazione funziona nello stesso modo sia che `x` contenga 3 elementi (come nel caso presente) sia che `x` contenga migliaia di elementi.

## Watermark

In [None]:
%load_ext watermark
%watermark -n -u -v -iv -w -p pytensor