# Calcolo scientifico con Numpy: i Vettori
Numpy è una libreria Python sviluppata appositamente per il calcolo scientifico, permette di operare su vettori e matrici anche di grandi dimensioni, utilizzando funzioni scritte in linguaggio C e quindi molto veloci.<br>
Come ogni libreria Python, per utilizzare Numpy è necessario prima importarla.

In [1]:
import numpy as np

## Vettori
Il calcolo tra vettori e matrici ricopre un ruolo fondamentale non solo nel Machine Learning, ma in ogni branca dell'Intelligenza Artificiale e dell'Informatica in generale.
Un vettore è un elemento che contiene un insieme ordinato di numeri disposti su una sola riga (vettore riga) o su una sola colonna.

$$ \textbf{v} = \begin{bmatrix} 5 & 3 & 9 & 1 & 6 \end{bmatrix} $$

$$ \textbf{v} = \begin{bmatrix}
    5 \\
    3 \\
    9 \\
    1 \\
    6
\end{bmatrix}
$$
Per creare un vettore numpy è sufficente passare una lista di numeri alla funzione <span style="font-family: Monaco">array</span>


In [2]:
v = [10, 15, 20, 25, 30] # lista python
type(v)

list

In [3]:
v = np.array(v) # vettore numpy
type(v)

numpy.ndarray

### Selezione degli elementi di un vettore
E' possibile accedere ad un elemento di un vettore nello stesso modo in cui si accede all'elemento di una lista, cioè utilizzando il suo indice.

In [4]:
print("Primo elemento del vettore: %d " % (v[0]))
print("Secondo elemento del vettore: %d " % (v[1]))

"""utilizzando indici negativi è possibile
accedere al vettore a ritroso"""

print("Ultimo elemento del vettore: %d " % (v[-1]))
print("Penultimo elemento del vettore: %d " % (v[-2]))

"""L'operatore ':' ci permette di eseguire lo slicing del vettore

"""

print("Primi 3 elementi del vettore: %s" % (v[:3])) #stampa gli elementi alla posizione 0,1 e 2
print("Ultimi 2 elementi del vettore: %s" % (v[-2:])) #stampa gli elementi alla posizione 3 e 4
print("Dal secondo al quarto elemento del vettore: %s" % (v[1:4]))

Primo elemento del vettore: 10 
Secondo elemento del vettore: 15 
Ultimo elemento del vettore: 30 
Penultimo elemento del vettore: 25 
Primi 3 elementi del vettore: [10 15 20]
Ultimi 2 elementi del vettore: [25 30]
Dal secondo al quarto elemento del vettore: [15 20 25]


Oltre al classico indexing, è anche possibile utilizzare delle maschere per selezionare solo i valori che soddisfano determinate condizioni.
Una maschera è semplicemente una lista di valori booleani, i valori dell'array che corrispondo ad un True nella maschera verranno selezionati, quelli che corrispondono ad un false verranno scartati.

In [5]:
mask = v>20 # creiamo una maschera per i valori di v che sono maggiori di 20
print(mask) # una maschera non è altro che una lista di valori booleani
print("Valori di v che sono maggiori di 20: %s" % v[mask]) # applichiamo la maschera come fosse un indice

[False False False  True  True]
Valori di v che sono maggiori di 20: [25 30]


Solitamente questo passaggio viene eseguito all'interno di un'unica istruzione

In [6]:
v_lm = v[v<v.mean()] # creiamo un nuovo vettore che contiene solo i valori di v che sono minori del valore medio
v_lm

array([10, 15])

**NOTA BENE** La sola applicazione di una maschera non modifica il vettore se non viene eseguita un'assegnazione.<br><br>


In [7]:
v[v<v.mean()] # il valore di v non cambia
print(v)

v = v[v<v.mean()] # il valore di v cambia
print(v)

[10 15 20 25 30]
[10 15]


### Modifica di un elemento di un vettore
Per modificare uno o più elementi di un vettore basta eseguire una semplice assegnazione

In [8]:
v = np.array([1, 2 , 3 ,4, 5]) # definisco un nuovo vettore
v[0] = 10 # sostituisco il valore 1 con 10 come primo elemento del vettore
v[1] = v[2]+v[3] # assegno la somma degli elementi alla posizione 3 e 4 del vettore all'emento in posizione 2 

"""
Adesso scambio gli elementi alle prime 2 posizioni
con quelli alle ultime due, per farlo creo un vettore temporaneo
"""

tmp = np.array([])
tmp = v[:2].copy() # utilizzo copy per eseguire un'assegnazione per valore e non per riferimento
v[:2] = v[-2:]
v[-2:] = tmp

print(v)

[ 4  5  3 10  7]


## Operazioni tra vettori

In [9]:
a = np.array([10, 20, 30, 40, 50])
b = np.array([5, 10, 15, 20, 25])

print("a + b = %s" % (a+b)) # somma tra i vettori a e b
print("a - b = %s" % (a-b)) # differenza tra i vettori a e b
print("a * b = %s" % (a*b)) # prodotto elemento per elemento dei vettori a e b

a + b = [15 30 45 60 75]
a - b = [ 5 10 15 20 25]
a * b = [  50  200  450  800 1250]


Perchè ho sottolineato che il prodotto è un prodotto "elemento per elemento" ? Perchè l'algebra lineare definisce anche un altro tipo di prodotto tra vettori, il prodotto scalare (in inglese: dot product), che da come risultato un singolo numero.
Il prodotto scalare è definito come la somma del prodotto di ogni elemento del vettore a per il corrispondente elemento del vettore b.<br>
<img src="res/dot_vec_vec.jpg" width="750px" />

In [10]:
np.dot(a,b) # prodotto scalare dei vettori a e b
np.dot(np.array([[1,3,5],[4,6,8]]),np.array([[4,2],[6,3],[1,4]]))

array([[27, 31],
       [60, 58]])

## Operazioni su un singolo vettore

In [11]:
v = np.array([5, 8 , 0, 9, 2])
print(v)
v = np.delete(v,3) # rimuove l'elemento alla posizone 3
print(v)
v = np.insert(v, 2, 13) # inserisci il valore 13 alla posizione 2
print(v)
np.random.shuffle(v) #mescola gli elementi nel vettore
print(v)

[5 8 0 9 2]
[5 8 0 2]
[ 5  8 13  0  2]
[ 8  5  2 13  0]


## Funzioni di base

In [12]:
print("Numero di elementi del vettore %d" % (len(v)))
print("Elementi ordinati del vettore: %s" % (np.sort(v)))
print("Somma di tutti gli elemento di v: %d" % (np.sum(v)))

Numero di elementi del vettore 5
Elementi ordinati del vettore: [ 0  2  5  8 13]
Somma di tutti gli elemento di v: 28
