# Introduzione alla computazione vettorizzata

## 1. Numpy ndarray

Creare un array e piuttosto semplice. Di per se possiamo immaginare gli ndarray di numpy come versioni potenziate dellle liste native di Python. 

In [1]:
import numpy as np 

data1 = [6, 7.5, 8, 9, 10]
arr1 = np.array(data1)

print(arr1)

[ 6.   7.5  8.   9.  10. ]


In [4]:
# specificare il tipo di dato 
arr2 = np.array(data1, dtype = np.int32)
print(arr2)

[ 6  7  8  9 10]


In [5]:
# creare degli array con inizialiazzazioni particolari
arr3 = np.ones(4)
print(arr3)

[1. 1. 1. 1.]


L'attributo fondamentale di un array numpy e la `shape`, ovvero la dimensione tensiorale dell'array. Questo concetto viene anche ripreso da librerie piu avanzate, come ad esempio PyTorch, Keras e Tensorflow. 

In [7]:
arr3.shape

(4,)

In [11]:
arr4 = np.ones((3,3,3))
print(arr4)

[[[1. 1. 1.]
  [1. 1. 1.]
  [1. 1. 1.]]

 [[1. 1. 1.]
  [1. 1. 1.]
  [1. 1. 1.]]

 [[1. 1. 1.]
  [1. 1. 1.]
  [1. 1. 1.]]]


Le operazioni tra array possono essere di due tipi: 
1. elemento per elemento (sia operazioni algebriche che booleanemoltiplicazioni),
2. algebriche: moltiplicazioni fra matrici riga per colonna. 

In [21]:
arr5 = np.array([
    [1., 2., 3.],
    [4., 5., 6.]
])

# element-wise addition
arr6 = arr5 + 1
print(arr6)
print("\n")

# elementwise multiplication
arr7 = arr5 * 3
print(arr7)
print("\n")

# elemntwise exponentiation
arr8 = arr5**2
print(arr8)
print("\n")

# element-wise operation between arrays
arr9 = arr5 * arr5
print("\n")

# boolean operation
print(arr9 == arr8)
print("\n")
print(arr9 > arr6)
print("\n")

# matrix multiplication 
print(arr9@arr5.T)

[[2. 3. 4.]
 [5. 6. 7.]]


[[ 3.  6.  9.]
 [12. 15. 18.]]


[[ 1.  4.  9.]
 [16. 25. 36.]]




[[ True  True  True]
 [ True  True  True]]


[[False  True  True]
 [ True  True  True]]


[[ 36.  78.]
 [174. 405.]]


## 2. Slicing

Una delle operazioni piu importanti che possiamo effettuare su un array e lo *slicing*, ovvero selezionare un sottogruppo degli elementi presenti nell'array original. Quest'operazione avviene in maniera simile sugli array numpy rispetto a quanto avverrebbe per le liste di Python, ma con qualche differenza fondamentale. 

In [31]:
# slices of numpy arrays are interactive windows on the array 
arr = np.arange(10)

print(arr[5])
print(arr[5:8])

print(arr[5:8] == arr[4:7])

arr[5:8] = 12
print(arr)
print(arr[5:8] == arr[4:7])

# bare slice : takes all values in that dimension
print(arr[:])

# multidimensional arrays
mda = np.ones((2,2))
print(mda[:,:])

5
[5 6 7]
[False False False]
[ 0  1  2  3  4 12 12 12  8  9]
[False  True  True]
[ 0  1  2  3  4 12 12 12  8  9]
[[1. 1.]
 [1. 1.]]


E importante sottolineare che ogni cambiamento effettuato sullo slice viene applicato all'array originale. Questo succede a meno che non si specifichi che lo slice che consideriamo non sia una copia completamente indipendente dall'array originale.

In [34]:
# creating a copy of a part of an ndarray. 
slice = arr[5:8].copy()
print(slice)

[12 12 12]


E anche possibile utilizzare condizioni booleane per creare lice dell'array. Questo permette di filtrare array molto grandi, individuando le righe che ci interessano da un dataset molto grande. Questo processo di filtraggio delle righe di un array e fondamentale per ogni applicazione di data analisi. 

In [48]:
# boolean indexing
example = np.arange(20)
filtered = example < 10
print(filtered)
print(example[filtered])

print(example[example<10])

# complex queries can be thought as multiple constraints 
mask = (example > 18) & (example < 10)
print(example[mask])

[ True  True  True  True  True  True  True  True  True  True False False
 False False False False False False False False]
[0 1 2 3 4 5 6 7 8 9]
[0 1 2 3 4 5 6 7 8 9]
[]


Esiste anche un metodo che permette di estrarre un sottoinsieme dell'array in un ordine specifico. Questo metodo prende il nome di *fancy* indexing. A difference delle slice di prima, le *fancy* slice sono array indipendenti da quello originale. 

In [59]:
# fancy indexing: selecting a nuber of rows in a particular order 
arr = np.arange(32).reshape((8,4))
print(arr)
print('\n')
print(arr[[3,2,7,4]])
print('\n')
print(arr[[3,2,7,4], [0,3,2,1]])
print('\n')

# reordering the fancy slice is possible
print(arr[[1,5,7,2]][:,[0,3,2,1]])

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]
 [16 17 18 19]
 [20 21 22 23]
 [24 25 26 27]
 [28 29 30 31]]


[[12 13 14 15]
 [ 8  9 10 11]
 [28 29 30 31]
 [16 17 18 19]]


[12 11 30 17]


[[ 4  7  6  5]
 [20 23 22 21]
 [28 31 30 29]
 [ 8 11 10  9]]


## 3. Funzioni Universali

Le funzioni universali sono particolati funzioni che applicano operazioni elemento per elemento ad un array numpy. 
Si dividono in: 
1. operazioni **unarie**: prendono un input due array e ne ritornano uno come risultato,
2. operazioni **binarie**: prendono due input due array e ne ritornano uno come risultato, del quale ogni elemento corrisponde all risultato dell'operazione applicata agli elementi con lo stesso indice nei due array input. 

In [67]:
# unary functions 
arr = np.arange(10)
print(np.sqrt(arr))
print("\n")
print(np.exp(arr))
print("\n")

# binary functions 
np.random.seed(42)
x = np.random.standard_normal(8) # sampling from a standard normal distribution
y = np.random.standard_normal(8)

print(np.maximum(x,y))
print('\n')
print(np.minimum(x,y))
print('\n')
print(np.floor_divide(x,y)) # truncating the remainder

[0.         1.         1.41421356 1.73205081 2.         2.23606798
 2.44948974 2.64575131 2.82842712 3.        ]


[1.00000000e+00 2.71828183e+00 7.38905610e+00 2.00855369e+01
 5.45981500e+01 1.48413159e+02 4.03428793e+02 1.09663316e+03
 2.98095799e+03 8.10308393e+03]


[ 0.49671415  0.54256004  0.64768854  1.52302986  0.24196227 -0.23413696
  1.57921282  0.76743473]


[-0.46947439 -0.1382643  -0.46341769 -0.46572975 -0.23415337 -1.91328024
 -1.72491783 -0.56228753]


[-2. -1. -2. -4. -1.  0. -1. -2.]


Una lista completa di tutte le funzioni universali puo essere trovata nella [documentazione](https://numpy.org/devdocs/reference/ufuncs.html#available-ufuncs) di numpy

## Programmazione orientata agli array

Programmare avendo gli array come mattoncini principali permette di ottenere molto vantaggi. Primo fra tutti, programmare in queso modo permette di ottenere un codice molto piu veloce di quello normale. Inoltre, di per se, qualsiasi libreria piu avanzata da per scontato questa tipologia di programmazione, che prende il nome di programmazione **vettorizzata**. 