# Welcome

Benvenuti al primo lavoro pratico della settimana! In questa pratica, impareremo a conoscere il linguaggio di programmazione Python, nonché NumPy e Matplotlib, due strumenti fondamentali per la scienza dei dati e l'apprendimento automatico in Python.

# Notebooks

Vedremo come usare Jupyter notebooks e Google colab per facilitare analisi dati. Notebooks sono un mix di codice eseguibile e contenuto aggiuntivo (HTML, immagini, equazioni). Colab permette di eseguire notebooks in cloud gratuitamente nessuna nessuna installazione.

Questa pagina non è statica ma è un ambiente interattivo chiamato notebook, che vi permette di scrivere ed eseguire codice. Per esempio, ecco una cella di codice che memorizza il risultato di un calcolo (il numero di secondi in un giorno) in una variabile e ne stampa il valore:

In [None]:
seconds_in_a_day = 24 * 60 * 60
seconds_in_a_day

Fare clic sul pulsante "play" per eseguire la cella. Dovresti essere in grado di vedere il risultato. In alternativa, puoi anche eseguire la cella premendo Ctrl + Invio se sei su Windows / Linux o Comando + Invio se sei su un Mac.

Le variabili definite in una cella possono essere successivamente utilizzate in altre celle:

In [None]:
seconds_in_a_week = 7 * seconds_in_a_day
seconds_in_a_week

Si noti che l'ordine di esecuzione è importante. Ad esempio, se non eseguiamo la cella memorizzando *seconds_in_a_day* in anticipo, la cella sopra genererà un errore, poiché dipende da questa variabile. Per assicurarti di eseguire tutte le celle nell'ordine corretto, puoi anche fare clic su "Cell" nel menu di primo livello, quindi su "Run All".

**Esercizio.** Aggiungi una cella sotto questa cella: fai clic su questa cella, quindi fai clic su "+ Codice". Nella nuova cella, calcola il numero di secondi in un anno riutilizzando la variabile *seconds_in_a_day*. Esegui la nuova cella.

# Python

Python è uno dei linguaggi di programmazione più popolari per l'analisi dati, sia nel mondo accademico che nell'industria. Pertanto, è essenziale imparare questa lingua per chiunque sia interessato all'analisi dati. In questa sezione esamineremo le basi di Python.

## Operazioni Aritimiche

Python supporta i consueti operatori aritmetici: + (addizione), * (moltiplicazione), / (divisione), ** (potenza), // (divisione intera).

## Liste

Le liste sono un tipo di contenitore per sequenze ordinate di elementi. Gli elenchi possono essere inizializzati vuoti

In [None]:
my_list = []

o con valari iniziali

In [None]:
my_list = [1, 2, 3]

Gli elenchi hanno una dimensione dinamica e gli elementi possono essere aggiunti (appended) ad essi

In [None]:
my_list.append(4)
my_list

Possiamo accedere ai singoli elementi di una lista (l'indicizzazione parte da 0)

In [None]:
my_list[2]

Possiamo accedere alle "slices" di una lista usando `my_list[i:j]` dove `i` è l'inizio dello slice (di nuovo, l'indicizzazione inizia da 0) e `j` la fine della slice. Per esempio:

In [None]:
my_list[1:3]

L'omissione del secondo indice significa che la slice dovrebbe essere eseguita fino alla fine dell'elenco

In [None]:
my_list[1:]

Possiamo controllare se è un elemento è nella lista con `in`

In [None]:
5 in my_list

La lunghezza di una lista può essere ottenuta usando la funzione `len`

In [None]:
len(my_list)

## Stringhe

Le stringhe vengono utilizzate per memorizzare il testo. Possono essere delimitati utilizzando virgolette singole o virgolette doppie

In [None]:
string1 = "some text"
string2 = 'some other text'

Le stringhe si comportano in modo simile alle liste. Pertanto, possiamo accedere ai singoli elementi esattamente allo stesso modo

In [None]:
string1[3]

e ugualmente per le slices

In [None]:
string1[5:]

La concatenazione di stringhe viene eseguita utilizzando l'operatore `+`

In [None]:
string1 + " " + string2

## Condizionali

Come indica il loro nome, i condizionali sono un modo per eseguire codice a seconda che una condizione sia vera o falsa. Come in altri linguaggi, Python supporta `if` e `else` ma `else if` è contratto in `elif`, come dimostra l'esempio seguente.

In [None]:
my_variable = 5
if my_variable < 0:
  print("negative")
elif my_variable == 0:
  print("null")
else: # my_variable > 0
  print("positive")

Here `<` and `>` are the strict `less` and `greater than` operators, while `==` is the equality operator (not to be confused with `=`, the variable assignment operator). The operators `<=` and `>=` can be used for less (resp. greater) than or equal comparisons.

Contrariamente ad altri linguaggi, i blocchi di codice sono delimitati mediante indentazione. Qui utilizziamo il rientro a 2 spazi, ma molti programmatori usano anche il rientro a 4 spazi. Chiunque va bene purché tu sia coerente in tutto il tuo codice.

## Loops

I loop sono un modo per eseguire un blocco di codice più volte. Esistono due tipi principali di loop: i loop while e i loop for.

While loop

In [None]:
i = 0
while i < len(my_list):
  print(my_list[i])
  i += 1 # equivalent to i = i + 1

For loop

In [None]:
for i in range(len(my_list)):
  print(my_list[i])

Se l'obiettivo è semplicemente quello di scorrere un elenco, possiamo farlo direttamente come segue

In [None]:
for element in my_list:
  print(element)

## Funzioni

Per migliorare la leggibilità del codice, è comune separare il codice in diversi blocchi, responsabili dell'esecuzione di azioni precise: funzioni. Una funzione prende alcuni input e li elabora per restituire alcuni output.

In [None]:
def square(x):
  return x ** 2

def multiply(a, b):
  return a * b

# Functions can be composed.
square(multiply(3, 2))

Per migliorare la leggibilità del codice, a volte è utile nominare esplicitamente gli argomenti

In [None]:
square(multiply(a=3, b=2))

## Esercizi

**Exercise 1.** Usando un for loop calcola la norma [Euclidean norm](https://en.wikipedia.org/wiki/Norm_(mathematics)#Euclidean_norm) di un vettore, rappresentato da un lista.

In [None]:
def euclidean_norm(vector):
  # Write your function here
  return

import numpy as np
my_vector = [0.5, -1.2, 3.3, 4.5]
# The result should be roughly 5.729746940310715
euclidean_norm(my_vector)

**Exercise 2.** Usando un for loop e un condizionale, scrive una funzione che ritorna il massimo in un vettore.

In [None]:
def vector_maximum(vector):
  # Write your function here
  return

## Andare oltre

Chiaramente, è impossibile coprire tutte le caratteristiche linguistiche in questa breve introduzione. Per andare oltre, ti consigliamo le seguenti risorse:



*   List of Python [tutorials](https://wiki.python.org/moin/BeginnersGuide/Programmers)
* Four-hour [course](https://www.youtube.com/watch?v=rfscVS0vtbw) on Youtube



# NumPy

NumPy è una libreria popolare per archiviare array di numeri ed eseguire calcoli su di essi. Non solo questo consente di scrivere codice spesso più conciso, ma rende anche il codice più veloce, poiché la maggior parte delle routine NumPy sono implementate in C per la velocità.

Per utilizzare NumPy nel tuo programma, devi importarlo come segue

In [None]:
import numpy as np

## Array creation



Gli array NumPy possono essere creati da liste Python

In [None]:
my_array = np.array([1, 2, 3])
my_array

NumPy supporta array di dimensioni arbitrarie. Ad esempio, possiamo creare array bidimensionali (ad esempio per memorizzare una matrice) come segue

In [None]:
my_2d_array = np.array([[1, 2, 3], [4, 5, 6]])
my_2d_array

Possiamo accedere ai singoli elementi di un array 2d utilizzando due indici

In [None]:
my_2d_array[1, 2]

Possiamo anche accedere alle righe

In [None]:
my_2d_array[1]

e colonne

In [None]:
my_2d_array[:, 2]

Gli array hanno un attributo `shape`

In [None]:
print(my_array.shape)
print(my_2d_array.shape)

Contrariamente alle liste Python, gli array NumPy devono avere un tipo e tutti gli elementi dell'array devono avere lo stesso tipo.

In [None]:
my_array.dtype

I tipi principali sono `int32` (interi a 32 bit), `int64` (interi a 64 bit), `float32` (valori reali a 32 bit) e `float64` (valori reali a 64 bit).

Il `dtype` può essere specificato durante la creazione dell'array

In [None]:
my_array = np.array([1, 2, 3], dtype=np.float64)
my_array.dtype

Possiamo creare array di tutti zeri usando

In [None]:
zero_array = np.zeros((2, 3))
zero_array

e allo stesso modo per tutti quelli che usano `uno` invece di `zero`.

Possiamo creare una gamma di valori utilizzando

In [None]:
np.arange(5)

o specificando il punto di partenza

In [None]:
np.arange(3, 5)

Un'altra routine utile è `linspace` per creare valori spaziati linearmente in un intervallo. Ad esempio, per creare 10 valori in `[0, 1]`, possiamo usare

In [None]:
np.linspace(0, 1, 10)

Un'altra operazione importante è `reshape`, per cambiare la forma di un array

In [None]:
my_array = np.array([1, 2, 3, 4, 5, 6])
my_array.reshape(3, 2)

Gioca con queste operazioni e assicurati di capirle bene.

## Basic operations

In NumPy, esprimiamo i calcoli direttamente sugli array. Questo rende il codice molto più conciso.

Le operazioni aritmetiche possono essere eseguite direttamente sugli array. Ad esempio, supponendo che due array abbiano una forma compatibile, possiamo aggiungerli come segue

In [None]:
array_a = np.array([1, 2, 3])
array_b = np.array([4, 5, 6])
array_a + array_b

Confronta questo con il calcolo equivalente usando un ciclo for

In [None]:
array_out = np.zeros_like(array_a)
for i in range(len(array_a)):
  array_out[i] = array_a[i] + array_b[i]
array_out

Non solo questo codice è più dettagliato, ma funzionerà anche molto più lentamente.

In NumPy, le funzioni che operano sugli array in base agli elementi sono chiamate [funzioni universali](https://numpy.org/doc/stable/reference/ufuncs.html). Ad esempio, questo è il caso di `np.sin`

In [None]:
np.sin(array_a)

Il prodotto interno vettoriale può essere eseguito utilizzando `np.dot`

In [None]:
np.dot(array_a, array_b)

Quando i due argomenti di `np.dot` sono entrambi array 2d, `np.dot` diventa una moltiplicazione di matrici

In [None]:
array_A = np.random.rand(5, 3)
array_B = np.random.randn(3, 4)
np.dot(array_A, array_B)

La trasposizione della matrice può essere eseguita usando `.transpose()` o `.T` in breve

In [None]:
array_A.T

## Slicing and masking

Come gli elenchi Python, gli array NumPy supportano lo slicing

In [None]:
np.arange(10)[5:]

Possiamo anche selezionare solo alcuni elementi dall'array

In [None]:
x = np.arange(10)
mask = x >= 5
x[mask]

## Exercises

**Esercizio 1.** Crea una matrice 3D di forme (2, 2, 2), contenente 8 valori. Accedi a singoli elementi e sezioni.

**Esercizio 3.** Riscrivi la norma euclidea di un vettore (array 1d) usando NumPy (senza ciclo for)

In [None]:
def euclidean_norm_numpy(x):
  return

my_vector = np.array([0.5, -1.2, 3.3, 4.5])
euclidean_norm_numpy(my_vector)

**Esercizio 4.** Scrivi una funzione che calcola le norme euclidee di una matrice (array 2d) in modo rigato. Suggerimento: usa l'argomento `axis` di [np.sum](https://numpy.org/doc/stable/reference/generated/numpy.sum.html).

In [None]:
def euclidean_norm_2d(X):
  return

my_matrix = np.array([[0.5, -1.2, 4.5],
                      [-3.2, 1.9, 2.7]])
# Should return an array of size 2.
euclidean_norm_2d(my_matrix)

**Esercizio 5.** Calcola il valore medio delle caratteristiche nel [set di dati iris](https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_iris.html). Suggerimento: usa l'argomento `axis` su [np.mean](https://numpy.org/doc/stable/reference/generated/numpy.mean.html).

In [None]:
from sklearn.datasets import load_iris
X, y = load_iris(return_X_y=True)

# Result should be an array of size 4.

## Going further

* NumPy [reference](https://numpy.org/doc/stable/reference/)
* SciPy [lectures](https://scipy-lectures.org/)
*   One-hour [tutorial](https://www.youtube.com/watch?v=QUT1VHiLmmI) on Youtube 



# Matplotlib

## Basic plots

Matplotlib è una libreria di plottaggio per Python.

Iniziamo con un rudimentale esempio di trama.

In [None]:
from matplotlib import pyplot as plt

x_values = np.linspace(-3, 3, 100)

plt.figure()
plt.plot(x_values, np.sin(x_values), label="Sinusoid")
plt.xlabel("x")
plt.ylabel("sin(x)")
plt.title("Matplotlib example")
plt.legend(loc="upper left")
plt.show()

Continuiamo con un rudimentale esempio di grafico a dispersione. Questo esempio mostra campioni da [iris dataset](https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_iris.html) utilizzando le prime due funzionalità. I colori indicano l'appartenenza alla classe (ci sono 3 classi).

In [None]:
from sklearn.datasets import load_iris
X, y = load_iris(return_X_y=True)

X_class0 = X[y == 0]
X_class1 = X[y == 1]
X_class2 = X[y == 2]

plt.figure()
plt.scatter(X_class0[:, 0], X_class0[:, 1], label="Class 0", color="C0")
plt.scatter(X_class1[:, 0], X_class1[:, 1], label="Class 1", color="C1")
plt.scatter(X_class2[:, 0], X_class2[:, 1], label="Class 2", color="C2")
plt.show()

Vediamo che i campioni appartenenti alla classe 0 possono essere separati linearmente dal resto utilizzando solo le prime due caratteristiche.

## Going further

*  Official [tutorial](https://matplotlib.org/tutorials/introductory/pyplot.html)
* [Tutorial](https://www.youtube.com/watch?v=qErBw-R2Ybk) on Youtube