# Gradient

I gradienti sono spesso utilizzati in alcuni algoritmi di apprendimento automatico, come ad esempio la Rete neurale artificiale (NN) o la Regressione logistica, per ottimizzare i parametri del modello durante il processo di addestramento.

Questo è fatto utilizzando una tecnica di ottimizzazione nota come gradient descent, in cui il gradiente viene calcolato per la funzione di perdita (che misura quanto il modello è "sbagliato") e utilizzato per aggiornare i pesi del modello nella direzione che riduce la perdita. Questo processo viene ripetuto fino a quando non viene raggiunta una certa precisione o il modello non converge.

## Logistic regression Gradient

Qui è un esempio di come un gradiente potrebbe essere utilizzato per addestrare un modello di regressione logistica:

In [2]:
import numpy as np

# Calcola il gradiente della funzione di perdita
def gradient(X, y, theta):
    m = len(y)
    h = sigmoid(X @ theta)
    gradient = (1/m) * X.T @ (h - y)
    return gradient

# La funzione di addestramento
def train(X, y, theta, learning_rate, num_iters):
    m = len(y)
    for i in range(num_iters):
        # Calcola il gradiente
        gradient = gradient(X, y, theta)
        
        # Aggiorna i pesi del modello utilizzando il gradient descent
        theta = theta - learning_rate * gradient
        
        # Stampa la perdita ogni 100 iterazioni
        if i % 100 == 0:
            loss = cost(X, y, theta)
            print("Loss at iteration %d: %f" % (i, loss))
    
    return theta


Questo è solo un esempio molto semplificato, ma dovrebbe darti un'idea di come un gradiente potrebbe essere utilizzato in un contesto di intelligenza artificiale.

## Neural Network (NN) Gradient

Un esempio di utilizzo del gradiente in una rete neurale artificiale (NN) può essere l'ottimizzazione dei pesi della rete tramite l'algoritmo di gradiente disceso.

In [7]:
import numpy as np

# Define la funzione di perdita (ad esempio la MSE)
def mean_squared_error(y_true, y_pred):
    return np.mean((y_true - y_pred)**2)

# Calcola il gradiente della funzione di perdita rispetto ai pesi della rete
def gradient(weights, input_data, target):
    # Passa i dati di input attraverso la rete
    predictions = network_function(input_data, weights)
    # Calcola l'errore tra le previsioni e i target
    error = mean_squared_error(target, predictions)
    # Calcola il gradiente della funzione di perdita rispetto ai pesi
    gradient = 2 * (predictions - target) * input_data
    return gradient, error

# Aggiorna i pesi della rete utilizzando il gradiente disceso
def update_weights(weights, gradient, learning_rate):
    weights -= learning_rate * gradient
    return weights

# Esempio di addestramento della rete
def train_network(input_data, target, weights, learning_rate, num_epochs):
    for epoch in range(num_epochs):
        # Calcola il gradiente della funzione di perdita rispetto ai pesi
        gradient, error = gradient(weights, input_data, target)
        # Aggiorna i pesi utilizzando il gradiente disceso
        weights = update_weights(weights, gradient, learning_rate)
        # Stampa l'errore per ogni epoch
        print("Epoch {}: loss = {}".format(epoch, error))
    return weights

# Inizializzare i pesi della rete e i dati di input/target
num_inputs = ... # Specificare il numero di variabili di input (input_data.shape[1])
num_outputs = ... # Specificare il numero di variabili di output (target.shape[1])
weights = np.random.randn(num_inputs, num_outputs) # Inizializza i pesi con valori casuali distribuiti normalmente
input_data = ... # Specificare i dati di input
target = ... # Specificare i target

# Iperparametri di addestramento
learning_rate = ... # Specificare il learning rate
num_epochs = ... # Specificare il numero di epoche

# Addestrare la rete per num_epochs
trained_weights = train_network(input_data, target, weights, learning_rate, num_epochs)


TypeError: 'ellipsis' object cannot be interpreted as an integer

In questo esempio, la funzione di perdita viene utilizzata per calcolare l'errore tra le previsioni della rete e i target. Il gradiente della funzione di perdita rispetto ai pesi della rete viene quindi calcolato e utilizzato per aggiornare i pesi della rete tramite l'algoritmo di gradiente disceso. L'addestramento della rete viene eseguito per un determinato numero di epoche (num_epochs), ogni volta calcolando il gradiente, aggiornando i pesi e stampando l'errore