# Modulo 1 – Introduzione a Python per Data Science & Machine Learning

Questo notebook introduce l'ambiente di lavoro per il Machine Learning in Python:

- Installazione e import dei pacchetti fondamentali
- Ripasso velocissimo di NumPy e Pandas
- Esempio completo di regressione lineare su dati sintetici


# 1. Apprendimento Supervisionato (Supervised Learning)
Come funziona: L'algoritmo viene addestrato su un set di dati di input già etichettato con i risultati corretti (ground truth).
Obiettivo: Imparare a mappare gli input agli output corretti per fare previsioni su nuovi dati.
Esempi: Classificazione (riconoscere immagini di cani/gatti), regressione (prevedere prezzi delle case). 
## 2. Apprendimento Non Supervisionato (Unsupervised Learning)
Come funziona: L'algoritmo analizza dati senza etichette per trovare strutture, schemi o raggruppamenti nascosti.
Obiettivo: Scoprire la struttura intrinseca dei dati.
Esempi: Clustering (raggruppare clienti simili), riduzione della dimensionalità. 
### 3. Apprendimento per Rinforzo (Reinforcement Learning)
Come funziona: Un "agente" impara interagendo con un ambiente, ricevendo ricompense per le azioni giuste e penalità per quelle sbagliate.
Obiettivo: Massimizzare la ricompensa totale nel tempo.
Esempi: Giochi (scacchi, Go), controllo robotico. 
Altri approcci
Semi-supervisionato: Combina una piccola quantità di dati etichettati con una grande quantità di dati non etichettati.
Deep Learning: Utilizza reti neurali profonde per imitare il cervello umano, spesso applicando i principi dei tre metodi sopra descritti su larga scala

In [None]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error


## 1. NumPy: array e operazioni vettoriali

In [None]:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
print('a + b =', a + b)
print('a * b =', a * b)


a + b = [5 7 9]
a * b = [ 4 10 18]


## 2. Pandas: DataFrame base

In [3]:
df = pd.DataFrame({
    'ore_studio': [1, 2, 3, 4, 5],
    'voto': [60, 65, 70, 80, 90]
})
print(df)


   ore_studio  voto
0           1    60
1           2    65
2           3    70
3           4    80
4           5    90


## 3. Primo modello: regressione lineare semplice

Useremo `ore_studio` per predire `voto`.

In [4]:
X = df[['ore_studio']].values  # feature 2D
y = df['voto'].values         # target 1D

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

model = LinearRegression()
model.fit(X_train, y_train)

y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)

print('Coefficienti:', model.coef_)
print('Intercetta:', model.intercept_)
print('MSE sul test:', mse)


Coefficienti: [7.42857143]
Intercetta: 50.857142857142854
MSE sul test: 0.5102040816326444
