# TP 2 - Régression linéaire (énoncé + solutions)
*M2 IWOCS, Apprentissage Automatique*

Ce notebook reprend l'énoncé du TP2 et insère, après chaque question, le(s) script(s) Python et la réponse attendue.

Remarque : exécutez les cellules dans l'ordre. Les chemins des fichiers de données attendus sont `ex1dat/` et `ex2dat/` (présents dans le même dossier que ce notebook).

## Exercice 1 - Régression linéaire univarié
Les données décrivent l'âge (`ex1dat/ex1x.dat`) et la taille (`ex1dat/ex1y.dat`) de 50 enfants. Nous allons construire un modèle de régression linéaire qui prédit la taille à partir de l'âge.

### 1) Charger les données avec `np.loadtxt`

In [None]:
import numpy as np
import matplotlib.pyplot as plt
# Chargement des données (chemin relatif)
x = np.loadtxt('ex1dat/ex1x.dat')
y = np.loadtxt('ex1dat/ex1y.dat')
print(f'Nombre dexemples : {x.shape[0]}')
# Préparer X avec biais pour usage matriciel si besoin
X_univ = np.c_[np.ones(x.shape[0]), x]
: 
,
: {
: 
,
: 

: [
2

: 
,
: {
: 
,
: 

: null,
: [],
: [
4
,
,
,
,
    theta = np.asarray(theta)
    return theta[0] + theta[1] * x

# Exemple rapide
theta_test = np.array([0.0, 0.0])
print('h_univ(theta_test, 5) =', h_univ(theta_test, 5))

### 4) Définir la fonction de coût $J(	heta)$ (moyenne des erreurs quadratiques)

In [None]:
def J_univ(theta, X, Y):
    """X doit être la matrice [1, x] ou on peut appeler avec x et y vecteurs"""
    m = Y.size
    theta = np.asarray(theta)
    predictions = theta[0] + theta[1] * X[:,1]
    return (1/(2*m)) * np.sum((predictions - Y)**2)

# Test rapide
print('J(theta_test) =', J_univ(theta_test, X_univ, y))

### 5) Itération de descente de gradient (formule explicite pour theta0 et theta1)
On implémente une fonction `iteration_univ` qui effectue une mise à jour de theta pour un pas alpha donné.

In [None]:
def iteration_univ(theta, X, Y, alpha):
    m = Y.size
    predictions = theta[0] + theta[1] * X[:,1]
    d0 = (1/m) * np.sum(predictions - Y)
    d1 = (1/m) * np.sum((predictions - Y) * X[:,1])
    theta_new = theta - alpha * np.array([d0, d1])
    return theta_new

# Test : plusieurs itérations et tracé de la droite
theta = np.zeros(2)
alpha = 0.07
for i in range(10):
    theta = iteration_univ(theta, X_univ, y, alpha)

plt.figure(figsize=(6,4))
plt.scatter(x, y, c='tab:blue', edgecolor='k')
xs = np.linspace(x.min(), x.max(), 100)
ys = theta[0] + theta[1] * xs
plt.plot(xs, ys, 'r-', label=f'Itération 10: y={theta[0]:.3f}+{theta[1]:.3f}x')
plt.legend()
plt.show()
print('theta après 10 itérations =', theta)

### 6) Faire converger la méthode de descente de gradient (critère d'arrêt sur J)
Critère donné : |(J(theta_old)-J(theta))/J(theta)| < 1e-3

In [None]:
theta = np.zeros(2)
alpha = 0.07
J_prev = J_univ(theta, X_univ, y)
for it in range(1, 5000):
    theta = iteration_univ(theta, X_univ, y, alpha)
    J_curr = J_univ(theta, X_univ, y)
    if abs((J_prev - J_curr) / (J_curr + 1e-12)) < 1e-3:
        print(f'Convergence atteinte à l\'itération {it}, J={J_curr:.6f}')
        break
    J_prev = J_curr
else:
    print('Nombre maximum d\'itérations atteint')

# Tracer la droite finale
plt.figure(figsize=(6,4))
plt.scatter(x, y, c='tab:blue', edgecolor='k')
xs = np.linspace(x.min(), x.max(), 100)
ys = theta[0] + theta[1] * xs
plt.plot(xs, ys, 'r-', label=f'Convergence: y={theta[0]:.3f}+{theta[1]:.3f}x')
plt.legend()
plt.show()
print('theta final =', theta)

### 7) Prédictions avec le modèle entraîné
Prédire la taille pour des âges 3, 5 et 7 ans.

In [None]:
ages = np.array([3,5,7])
preds = h_univ(theta, ages)
for age, p in zip(ages, preds):
    print(f'Age: {age} ans -> taille prédite: {p:.3f} m')

### 8) Visualiser J(	heta) en 3D sur une grille 100x100

In [None]:
from mpl_toolkits.mplot3d import Axes3D
theta0_vals = np.linspace(-30, 30, 100)
theta1_vals = np.linspace(-3, 3, 100)
J_vals = np.zeros((theta0_vals.size, theta1_vals.size))
for i, t0 in enumerate(theta0_vals):
    for j, t1 in enumerate(theta1_vals):
        J_vals[i,j] = J_univ([t0, t1], X_univ, y)

T0, T1 = np.meshgrid(theta0_vals, theta1_vals)
# Tracer la surface (attention au temps de calcul)
fig = plt.figure(figsize=(10,6))
ax = fig.add_subplot(111, projection='3d')
ax.plot_surface(T0, T1, J_vals.T, cmap='viridis', edgecolor='none', alpha=0.8)
ax.set_xlabel('theta0')
ax.set_ylabel('theta1')
ax.set_zlabel('J(theta)')
plt.title('Surface de la fonction de coût J(theta)')
plt.show()

## Exercice 2 - Régression linéaire multivariée
,

: 
,
: {
: 
,
: 

: [
1

: 
,
: {
: 
,
: 

: null,
: [],
: [
2
,
,

: 
,
: {
: 
,
: 

: [
2

: 
,
: {
: 
,
: 

: null,
: [],
: [
,
,
,
,

,
,

: 
,
: {
: 
,
: 

: [
3

: 
,
: {
: 
,
: 

: null,
: [],
: [
,
,
,
,
,
,
,
1
,

: 
,
: {
: 
,
: 

: [
4
0.07

: 
,
: {
: 
,
: 

: null,
: [],
: [
0.07
,
1
,
,
5000
,
,
1e-12
0.000001
,
,
,

: 
,
: {
: 
,
: 

: [
5
0.001
10
,
50

: 
,
: {
: 
,
: 

: null,
: [],
: [
,
20
,
50
,
,
10
,
1
,
,
,
,
-1
,
,
,
,