# Esercitazione 1

In [1]:
import numpy as np
import matplotlib.pyplot as plt
import random as rn

def plot_separation(X, y, a, a0, name=None):
    '''
    Input: X vettore 2xn dove la colonna j rappresenta il punto j nello spazio delle features
        y: vettore di dimensione n, y[j] è l'etichetta di X[:,j:j+1] (colonna j di X)
        a: vettore 2x1
        a0: float, rappresentano i coefficienti del piano di separazione
    Output: None, crea un file png che mostra lo spazio delle features e il piano di separazione
    '''
    plt.scatter(X[0:1,:], X[1:2,:], c=['g' if lab == 1 else 'r' for lab in y], s=7)
     
    ax = plt.gca()
    
    # piano di separazione
    xlim_left, xlim_right = ax.get_xlim()
    ylim_bottom, ylim_top = ax.get_ylim()
    
    plt.plot( ( xlim_left, xlim_right) , [ (-x*a[0][0]-a0)/a[1][0] for x in  (xlim_left, xlim_right) ],\
             linewidth=1,
             c = 'b', zorder=0 ) # a0 è una matrice di dimensione 1x1
     
    arrow_size = 0.05
   
   # assi 
    plt.arrow( xlim_left, 0, xlim_right-xlim_left, 0,   width=0.01,\
              head_width= arrow_size, length_includes_head=True,\
              color='lightgrey', zorder=-1)
    plt.arrow( 0, ylim_bottom, 0, ylim_top-ylim_bottom,   width=0.01,\
              head_width= arrow_size, length_includes_head=True,\
              color='lightgrey', zorder=-1)    


    # plot del vettore perpendicolare al piano
    
    # punto centrale del piano
    mx = (xlim_left+xlim_right)/2
    my = (-mx*a[0][0]-a0)/a[1][0]

    
    
    u = a/np.linalg.norm(a) # vettore unitario ortogonale ad a
    
    # spostiamo l'origine del vettore a sul punto (mx, my) 
    plt.arrow(mx, my, u[0][0], u[1][0], width=0.01,\
              head_width= arrow_size, length_includes_head=True,\
              color='orange', zorder=0)
    
        
    
    ax.set_aspect('equal', adjustable='box')
    
    ax.set_xbound(xlim_left, xlim_right)
    ax.set_ybound(ylim_bottom, ylim_top)
    
    if name != None:
        plt.savefig(name, dpi=600)

    plt.show()

def perceptron( X, y, t = 100 ):
    '''
    Parameters
    ----------
    X : vettore (ndarray) d x n dove d è lo spazio delle features, n numero degli esempi
    y : vettore delle etichette, di dimensione
    t : intero positivo, numero massimo di iterazioni

    Returns
    -------
    a : vettore dei cefficienti dell'iperpiano di dimensione d
    a0: termine noto
    '''
    
    d, n = X.shape
    
    a = np.zeros( (d, 1) )
    a0 = 0
    
    for j in range(t):
        finito = True
        for i in range(n):
            x = X[:,i:i+1] # colonna i di X
            if y[i]*(a.T.dot(x) + a0) <= 0:
                a = a + x*y[i]
                a0 = a0 + y[i]
                finito = False
        if finito: # equivalente a finito == True
            break
                
    return a, a0

## Esercizio 1

Scrivere una funzione, denominata `sign`, che preda in input un iperpiano `h` descritto dal vettore dei coefficienti `a` in $d \times 1$ e termine noto `a0` e un vettore `x` $d \times 1$. Ritorna `1` se  `ax+a0 >= 0`,  `-1` altrimenti

## Esercizio 2

Modificare la funzione `perceptron()` in modo che ritorni anche il margine del dataset rispetto l'iperpiano trovato nel caso in cui questo lo separi linearmente oppure `None`.

## Esercizio 3

Scrivere una funzione, denominata `get_dataset`, che prenda in input un iperpiano `a`, `a0` (`a` è un vettore colonna $d\times 1$ ), un intero `n` ed un float `s`. La funzione ritorni un dataset casuale di `n` punti in $(-s,s)^d$ linearmente separabile da `a`, `a0`.

In particolare la funzione deve ritornare un vettore $d\times n$ dove ogni colonna rappresenta un punto in $(-s,s)^d$ ed un vettore di etichette `y` di dimensione `n` tale che `y[i]` vale `-1` o `1`.

Testare l'algoritmo perceptron modificato con il dataset ritornato dalla funzione, verificare che il margine sia non `None`.

*Suggerimento*. Potrebbero essere utili le funzioni `rn.choice()` per la scelta del segno e `rn.random()` che ritorna un numero causale in $[0,1)$.

## Esercizio 4

Scrivere una funzione, chiamata `flip_labels` che perturbi il dataset fornito dalla  precedente funzione invertendo, con una probabilità p, i valori delle etichette 

La funzione prenda in input il vettore delle etichette `y` di dimensione $1 \times d$, la probabilità `p` e ritorni il nuovo vettore delle etichette perturbato.

Cosa può essere utile: la funzione random.random() restituisce un numero pseudo-casuale
in [0,1)