In [None]:
import numpy as np
import matplotlib.pyplot as plt
from utils import *

# Basi di array e matrici

### Un array è un insieme ordinato di valori. Creare un vettore di 5 elementi e visualizzare gli elementi
x = np.array([1, -2.1, 3.4, 0, -0.9])

print(x)

In [None]:
x = np.array([1, -2.1, 3.4, 0, -0.9])
print(x)

### Accedere agli elementi dell'array
Per accedere al singolo elemento di un array è necessario scrivere il nome dell'array e usare un indice numerico tra 0 e N-1 (dove N è il numero di elementi dell'array) inserito tra parentesi quadre. Esempio: **x[2]**

print(x[0])

print(x[3])

In [None]:
print(x[0])
print(x[3])

### Accedere ad un sottoinsieme dell'array. Notazione *x[indice_inizio:indice_fine_escluso]*
x[2:4]

In [None]:
print(x[2:4])

### Somma/sottrazione tra due array: possibile solo se la dimensione è la stessa.
x = np.array([1, -2.1, 3.4, 0, -0.9])

y = np.array([0, 1, 2, 3, 4])

z = x + y

In [None]:
x = np.array([1, -2.1, 3.4, 0, -0.9])
y = np.array([0, 1, 2, 3, 4])
z = x + y
print(z)

### Funzioni: sono degli oggetti a cui fornisci un valore **x** e restituisce un valore **y**

Esempi:

- y = x**2

- y = np.sqrt(x) + 1

- y = np.sin(x)

In python si definiscono così:

def *function_name*(x):

&emsp;# Calcolo di y

&emsp;return y

Si usano così:

y = *function_name*(x)

In [None]:
def potenza2(x):
    y = x**2
    return y

x = np.array([0, 1, 2, 3, 4])
y = potenza2(x)
print(y)

### Disegno di grafici a linee. 

Un grafico a linee è rappresentato come una sequenza di punti (x_i, y_i) che vengono connessi con una linea.

In [None]:
x = np.array([-4, -3, -2, -1, 0, 1, 2, 3, 4])
y = potenza2(x)

plt.plot(x, y)
plt.xlabel('X')
plt.ylabel('Y')

### Definire un range per i valori della x e salvarli in un array.

x = np.arange(*valore_inizio*, *valore_fine*, *passo*)

In [None]:
x = np.arange(-3, 3, 0.1)
print(x)

In [None]:
y = potenza2(x)
plt.plot(x, y)

### Esercizio: 

- Definire la funzione *myfunc* che calcoli e restituisca il prodotto tra x**2 e sin(x) (in python è np.sin(x))

- Definire un range di valori per la x da -5 a 5 con passo=0.1

- Calcolare il valore della funzione *myfunc* nei valori di x appena generati

- Disegnare il grafico a linee per x e y

In [None]:
def myfunc(x):
    y = (x**2)*np.sin(x)
    return y

x = np.arange(-5, 5, 0.1)
y = myfunc(x)
plt.plot(x, y)

### Matrici

Estensione del concetto di array in 2D. Equivale ad una tabella indicizzata da coppie di numeri (riga e colonna).

X = np.zeros((4, 5))

In [None]:
X = np.zeros((4, 5))
print(X)

### Prelevare un elemento da una matrice

X[2, 3]

### Impostare un elemento della matrice

X[2, 3] = -2


In [None]:
X[2, 3] = -2
print(X)


In [None]:
### Prelevare un sottoinsieme: simile ad array ma con 2 dimensioni

X[1:3, 2:4]

### Dimensione di un array o matrice

X.shape

In [None]:
print(X.shape)

### Caricamento di un dataset csv

Carichiamo il dataset salvato in *datasets/fever.csv* contenente le misurazioni di temperatura di alcuni pazienti a cui è stato chiesto se sentivano di aver febbre oppure no.

Ogni riga è associata ad un paziente, la prima colonna è la temperatura di quando il paziente non sentiva febbre mentre la seconda è associata alla sensazione di febbre.

In [None]:
X = np.loadtxt('datasets/fever.csv', delimiter=',')
print(X)
print(X.shape)

In [None]:
# Grafico a linee. Utile?
plt.plot(X)

### Boxplot

Rappresentazione compatta della distrubuzione di un insieme di misurazioni:

- La linea rossa è la mediana: il 50% delle misurazioni sono al di sotto di questo valore
- Il rettangolo mostra il 25° e 75° percentile: il n° percentile è quel valore di misurazione tale per cui n% delle misurazioni sono al di sotto
- I baffi rappresentano un possibile limite della distribuzione

In [None]:
# Usiamo i boxplot.
T1 = X[:, 0]
T2 = X[:, 1]
plt.boxplot([T1, T2], tick_labels=['No febbre', 'Febbre']);

### Correlazione: le misurazioni della temperatura ottenute in condizioni di assenza di febbre ci dicono qualcosa sulla possibile misurazioni di febbre?

Un possibile modo per valutare questa dipendenza è la cosidetta correlazione.

Proviamo a disegnare un grafico a punti (chiamato scatterplot) dove sull'asse x avremo la temperatura senza febbre e sull'asse y la temperatura in condizioni di febbre.

In [None]:
plt.scatter(T1, T2)
plt.xlabel('T (°C) - no febbre')
plt.ylabel('T (°C) - febbre')

### Esercizio

Ci è stato consegnato un dataset la cui prima colonna è la temperatura corporea e la seconda colonna è il numero di ore passato a letto.

Il dataset si chiama *fever2.csv* nella cartella dataset.

- Caricare il dataset in python

- Estrarre la prima colonna e chiamarla *T*

- Estrarre la seconda colonna e chiamarla *H*

- Verificare se c'è una dipendenza tra le due variabili con uno scatterplot

In [None]:
X = np.loadtxt('datasets/fever2.csv', delimiter=',')

In [None]:
T = X[:, 0]
H = X[:, 1]
plt.scatter(H, T)
plt.xlabel('H (ore)')
plt.ylabel('T (°C)')

La terza colonna (X[:, 2]) indica se la persona ha la febbre oppure no. 

F[i] vale 1 se la persona ha la febbre o 0 se non ce l'ha.

*Verificare se c'è correlazione tra temperatura e ore dormite nella popolazione con la febbre.*

In [None]:
F = X[:, 2]
print(F)

### Boolean indexing

Serve per prelevare un sottoinsieme di un array in base ad un certa condizione. Supponiamo di avere l'array F e di volere testare se gli elementi di F siano uguali a 1. Per fare questo basta fare: F==1.

Se questo venisse usato tra le parentesi quadre di un altro array della stessa dimensione, verrebbe creato un array con tutti gli elementi la cui condizione corrispondente è a *True*. Per fare questo basta fare: T1 = T[F==1]

In [None]:
F==1

In [None]:
Tfebbre = T[F==1]
Hfebbre = H[F==1]
plt.scatter(Hfebbre, Tfebbre)
plt.xlabel('H (ore)')
plt.ylabel('T (°C)')

### Disegniamo il causal graph

Digitare *plot_causal_graph_fever2()*

In [None]:
plot_causal_graph_fever2()