# 📚 SOLUTIONS - Calcul Différentiel

**Solutions complètes et détaillées** 🎯

---

## 📖 Comment utiliser ?

1. Essayez l'exercice vous-même d'abord
2. Comparez avec la solution
3. Comprenez la méthode et les étapes
4. Exécutez le code pour vérifier

---

## Section 4 : Dérivées Partielles - Solutions

### Exercice 4.1 : Dérivées Partielles Simples

In [None]:
import sympy as sp
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

x, y, z = sp.symbols('x y z')

# Solution 4.1: Dérivées Partielles Simples
print('SOLUTION 4.1: Dérivées Partielles Simples')
print('='*70)

f = x**2 * y + 3*x*y**2

# Dérivée partielle par rapport à x (y est constante)
df_dx = sp.diff(f, x)
# Dérivée partielle par rapport à y (x est constante)
df_dy = sp.diff(f, y)

print(f'f(x,y) = {f}')
print(f'∂f/∂x = {df_dx}  (traiter y comme constante)')
print(f'∂f/∂y = {df_dy}  (traiter x comme constante)')

# Évaluation en (2, 3)
val_x = df_dx.subs([(x, 2), (y, 3)])
val_y = df_dy.subs([(x, 2), (y, 3)])
print(f'\n∂f/∂x|_(2,3) = {val_x}')
print(f'∂f/∂y|_(2,3) = {val_y}')
print(f'\nInterprétation: En (2,3), f augmente de {val_x} unités si x augmente')
print(f'                et de {val_y} unités si y augmente')


### Exercice 4.2 : Fonction à Trois Variables

In [None]:
# Solution 4.2: Fonction à Trois Variables
print('\n\nSOLUTION 4.2: Fonction à Trois Variables')
print('='*70)

f = x**2 + y**2 + z**2 + x*y + y*z

df_dx = sp.diff(f, x)
df_dy = sp.diff(f, y)
df_dz = sp.diff(f, z)

print(f'f(x,y,z) = {f}')
print(f'\nDérivées partielles:')
print(f'∂f/∂x = {df_dx}')
print(f'∂f/∂y = {df_dy}')
print(f'∂f/∂z = {df_dz}')

print(f'\nLe gradient ∇f(x,y,z) = ')
print(f'[ {df_dx} ]')
print(f'[ {df_dy} ]')
print(f'[ {df_dz} ]')

# Exemple d'évaluation
point = {x: 1, y: 1, z: 1}
grad_val = [df_dx.subs(point), df_dy.subs(point), df_dz.subs(point)]
print(f'\n∇f(1,1,1) = {grad_val}')


### Exercice 4.3 : Dérivées Partielles d'Ordre 2

In [None]:
# Solution 4.3: Dérivées Partielles d'Ordre 2
print('\n\nSOLUTION 4.3: Dérivées Partielles d\'Ordre 2')
print('='*70)

f = x**3 * y**2

# Dérivées secondes
f_xx = sp.diff(f, x, 2)  # Dérivée 2 fois par rapport à x
f_yy = sp.diff(f, y, 2)  # Dérivée 2 fois par rapport à y
f_xy = sp.diff(f, x, y)  # Dérivée d'abord par x, puis par y
f_yx = sp.diff(f, y, x)  # Dérivée d'abord par y, puis par x

print(f'f(x,y) = {f}')
print(f'\nPremières dérivées:')
df_dx = sp.diff(f, x)
df_dy = sp.diff(f, y)
print(f'∂f/∂x = {df_dx}')
print(f'∂f/∂y = {df_dy}')

print(f'\nDérivées secondes:')
print(f'∂²f/∂x² = {f_xx}')
print(f'∂²f/∂y² = {f_yy}')
print(f'∂²f/∂x∂y = {f_xy}')
print(f'∂²f/∂y∂x = {f_yx}')

# Vérification du théorème de Schwarz
difference = sp.simplify(f_xy - f_yx)
print(f'\nThéorème de Schwarz: ∂²f/∂x∂y = ∂²f/∂y∂x?')
print(f'Différence: {difference}')
print(f'✓ Égales! (pour fonctions bien-behaved)' if difference == 0 else '✗ Différentes!')


### Exercice 4.4 : Visualisation de Surface 3D

In [None]:
# Solution 4.4: Visualisation de Surface 3D
print('\n\nSOLUTION 4.4: Visualisation de Surface 3D')
print('='*70)

fig = plt.figure(figsize=(15, 5))

# Surface 3D
ax1 = fig.add_subplot(131, projection='3d')
x_vals = np.linspace(-3, 3, 100)
y_vals = np.linspace(-3, 3, 100)
X, Y = np.meshgrid(x_vals, y_vals)
Z = X**2 - Y**2

surf = ax1.plot_surface(X, Y, Z, cmap='viridis', alpha=0.8, edgecolor='none')
ax1.set_xlabel('x', fontsize=10)
ax1.set_ylabel('y', fontsize=10)
ax1.set_zlabel('f(x,y)', fontsize=10)
ax1.set_title('Surface: f(x,y) = x² - y²', fontsize=11)
fig.colorbar(surf, ax=ax1, shrink=0.5)

# Contour plot avec gradients
ax2 = fig.add_subplot(132)
contour = ax2.contour(X, Y, Z, levels=15, cmap='viridis')
ax2.clabel(contour, inline=True, fontsize=8)

# Calcul des gradients en plusieurs points
points = [(1, 1), (-1, 1), (1, -1), (-1, -1)]
for px, py in points:
    grad_x = 2*px     # ∂f/∂x = 2x
    grad_y = -2*py    # ∂f/∂y = -2y
    ax2.quiver(px, py, grad_x, grad_y, scale=15, color='red', width=0.003)
    ax2.plot(px, py, 'ro', markersize=6)

ax2.set_xlabel('x', fontsize=10)
ax2.set_ylabel('y', fontsize=10)
ax2.set_title('Contours + Champ de gradients', fontsize=11)
ax2.grid(True, alpha=0.3)

# Dérivées numériques
ax3 = fig.add_subplot(133)
point_x, point_y = 1, 1
grad_x_val = 2*point_x
grad_y_val = -2*point_y
text_content = f'En ({point_x},{point_y}):\n'
text_content += f'∂f/∂x = 2x = {grad_x_val}\n'
text_content += f'∂f/∂y = -2y = {grad_y_val}\n\n'
text_content += f'Gradient ∇f = [{grad_x_val}, {grad_y_val}]\n'
text_content += f'Norme: |∇f| = {np.sqrt(grad_x_val**2 + grad_y_val**2):.3f}'
ax3.text(0.1, 0.5, text_content, fontsize=11, family='monospace',
         bbox=dict(boxstyle='round', facecolor='wheat', alpha=0.5),
         verticalalignment='center')
ax3.axis('off')

plt.tight_layout()
plt.show()

print('Observations:')
print('1. Les gradients (vecteurs rouges) sont perpendiculaires aux courbes de niveau')
print('2. Les gradients pointent vers l\'augmentation la plus rapide de f')
print('3. C\'est une surface de type "selle de cheval" (hyperboloïde)')


### Exercice 4.5 : Application ML - Loss Function

In [None]:
# Solution 4.5: Application ML - Loss Function
print('\n\nSOLUTION 4.5: Application ML - Loss Function')
print('='*70)

w, b = sp.symbols('w b')
x_data, y_data = 2, 5

# Loss function: L = (y - ŷ)² où ŷ = wx + b
y_pred = w * x_data + b
L = (y_data - y_pred)**2

print(f'Données: x={x_data}, y={y_data}')
print(f'Modèle: ŷ = wx + b = {x_data}w + b')
print(f'Loss: L = (y - ŷ)² = (5 - (2w + b))²')
print(f'Développé: L = {sp.expand(L)}')

# Dérivées partielles
dL_dw = sp.diff(L, w)
dL_db = sp.diff(L, b)

print(f'\nGradients:')
print(f'∂L/∂w = {dL_dw}')
print(f'∂L/∂b = {dL_db}')

# Évaluation en (w=1, b=0)
w_val, b_val = 1, 0
grad_w = dL_dw.subs([(w, w_val), (b, b_val)])
grad_b = dL_db.subs([(w, w_val), (b, b_val)])
loss_val = L.subs([(w, w_val), (b, b_val)])

print(f'\nÉvaluation en (w={w_val}, b={b_val}):')
print(f'L({w_val},{b_val}) = {loss_val}')
print(f'∂L/∂w|_(1,0) = {grad_w}')
print(f'∂L/∂b|_(1,0) = {grad_b}')

print(f'\nInterprtation pour Gradient Descent:')
print(f'Les gradients sont NÉGATIFS: w_new = w - α∗∂L/∂w = 1 - α∗({grad_w}) → augmente w')
print(f'                              b_new = b - α∗∂L/∂b = 0 - α∗({grad_b}) → augmente b')
print(f'Cela a du sens: on augmente w et b pour que ŷ = 2w + b se rapproche de y = 5')


## Section 5 : Gradient - Solutions

### Exercice 5.1 : Calculer le Gradient

In [None]:
# Solution 5.1: Calculer le Gradient
print('\n\nSOLUTION 5.1: Calculer le Gradient')
print('='*70)

x, y, z = sp.symbols('x y z')

# Fonction 1
f1 = x**2 + y**2
grad_f1 = [sp.diff(f1, x), sp.diff(f1, y)]
print(f'1. f(x,y) = {f1}')
print(f'   ∇f = {grad_f1}')

# Fonction 2
f2 = x*y
grad_f2 = [sp.diff(f2, x), sp.diff(f2, y)]
print(f'\n2. g(x,y) = {f2}')
print(f'   ∇g = {grad_f2}')

# Fonction 3
f3 = x**2 + 2*y**2 + 3*z**2
grad_f3 = [sp.diff(f3, x), sp.diff(f3, y), sp.diff(f3, z)]
print(f'\n3. h(x,y,z) = {f3}')
print(f'   ∇h = {grad_f3}')

# Fonction 4
f4 = sp.exp(x + y)
grad_f4 = [sp.diff(f4, x), sp.diff(f4, y)]
print(f'\n4. k(x,y) = {f4}')
print(f'   ∇k = {grad_f4}')
print(f'   Simplifiée: ∇k = [e^(x+y), e^(x+y)]')


### Exercice 5.2 : Norme et Direction du Gradient

In [None]:
# Solution 5.2: Norme et Direction du Gradient
print('\n\nSOLUTION 5.2: Norme et Direction du Gradient')
print('='*70)

# f(x,y) = x² + 2y²
f = x**2 + 2*y**2
grad_x = sp.diff(f, x)
grad_y = sp.diff(f, y)

print(f'f(x,y) = {f}')
print(f'∇f = [{grad_x}, {grad_y}]')

# Évaluation en (1, 1)
point = {x: 1, y: 1}
grad_val_x = grad_x.subs(point)
grad_val_y = grad_y.subs(point)
grad_val = np.array([float(grad_val_x), float(grad_val_y)])

print(f'\nEn (1, 1):')
print(f'∇f(1,1) = [{grad_val_x}, {grad_val_y}] = {grad_val}')

# Norme du gradient
norm = np.linalg.norm(grad_val)
print(f'\nNorme: ||∇f|| = √(2² + 4²) = √20 = {norm:.4f}')

# Direction normalisée (vecteur unitaire)
direction = grad_val / norm
print(f'\nDirection normalisée (vecteur unitaire):')
print(f'û = ∇f / ||∇f|| = [{direction[0]:.4f}, {direction[1]:.4f}]')

print(f'\nInterprétation:')
print(f'- Le gradient ∇f = [2, 4] indique la MONTÉE la plus rapide')
print(f'- Pour la DESCENTE, on va dans la direction -∇f = [-2, -4]')
print(f'- Le taux de montée maximal est ||∇f|| = {norm:.4f} unités')


### Exercice 5.3 : Gradient Descent 2D

In [None]:
# Solution 5.3: Gradient Descent 2D
print('\n\nSOLUTION 5.3: Gradient Descent 2D')
print('='*70)

# f(x,y) = (x-3)² + (y+2)²
# ∇f = [2(x-3), 2(y+2)]

def f(x_val, y_val):
    return (x_val - 3)**2 + (y_val + 2)**2

def gradient(x_val, y_val):
    grad_x = 2*(x_val - 3)
    grad_y = 2*(y_val + 2)
    return np.array([grad_x, grad_y])

# Gradient Descent
x_pos, y_pos = 0.0, 0.0
alpha = 0.1
iterations = 30

trajectory = [(x_pos, y_pos)]
losses = [f(x_pos, y_pos)]

print(f'Paramètres:')
print(f'Position initiale: ({x_pos}, {y_pos})')
print(f'Learning rate α = {alpha}')
print(f'Itérations: {iterations}')
print(f'\nAlgorithme: (x,y) = (x,y) - α∇f')

for i in range(iterations):
    grad = gradient(x_pos, y_pos)
    x_pos -= alpha * grad[0]
    y_pos -= alpha * grad[1]
    trajectory.append((x_pos, y_pos))
    losses.append(f(x_pos, y_pos))

trajectory = np.array(trajectory)
print(f'\nRésultats:')
print(f'Position finale: ({x_pos:.6f}, {y_pos:.6f})')
print(f'Minimum attendu: (3, -2)')
print(f'Loss initiale: {losses[0]:.6f}')
print(f'Loss finale: {losses[-1]:.6f}')

# Visualisation
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Contour plot avec trajectoire
ax1 = axes[0]
x_range = np.linspace(-1, 5, 100)
y_range = np.linspace(-4, 1, 100)
X, Y = np.meshgrid(x_range, y_range)
Z = (X - 3)**2 + (Y + 2)**2

contour = ax1.contour(X, Y, Z, levels=20, cmap='viridis')
ax1.clabel(contour, inline=True, fontsize=8)
ax1.plot(trajectory[:, 0], trajectory[:, 1], 'r.-', linewidth=2, markersize=4, label='Trajectoire')
ax1.plot(0, 0, 'go', markersize=10, label='Départ')
ax1.plot(3, -2, 'r*', markersize=20, label='Minimum')
ax1.set_xlabel('x', fontsize=11)
ax1.set_ylabel('y', fontsize=11)
ax1.set_title('Gradient Descent: Trajectoire', fontsize=12)
ax1.legend()
ax1.grid(True, alpha=0.3)

# Loss vs iteration
ax2 = axes[1]
ax2.semilogy(range(len(losses)), losses, 'b-', linewidth=2, marker='o', markersize=4)
ax2.set_xlabel('Itération', fontsize=11)
ax2.set_ylabel('Loss (échelle log)', fontsize=11)
ax2.set_title('Décroissance de la Loss', fontsize=12)
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()


### Exercice 5.4 : Champ de Gradients

In [None]:
# Solution 5.4: Champ de Gradients
print('\n\nSOLUTION 5.4: Champ de Gradients')
print('='*70)

# f(x,y) = 0.5*(x² + y²)
# ∇f = [x, y]

fig, ax = plt.subplots(figsize=(10, 10))

# Création de la grille
x_range = np.linspace(-3, 3, 20)
y_range = np.linspace(-3, 3, 20)
X, Y = np.meshgrid(x_range, y_range)
Z = 0.5 * (X**2 + Y**2)

# Calcul du gradient
U = X  # ∂f/∂x = x
V = Y  # ∂f/∂y = y

# Contours
contour = ax.contour(X, Y, Z, levels=15, cmap='viridis', alpha=0.6)
ax.clabel(contour, inline=True, fontsize=8)

# Champ de vecteurs (gradients)
quiver = ax.quiver(X, Y, U, V, np.sqrt(U**2 + V**2), cmap='hot', scale=30, width=0.003)
cbar = plt.colorbar(quiver, ax=ax)
cbar.set_label('||∇f||', fontsize=11)

ax.set_xlabel('x', fontsize=11)
ax.set_ylabel('y', fontsize=11)
ax.set_title('f(x,y) = 0.5(x² + y²): Contours + Champ de Gradients', fontsize=12)
ax.grid(True, alpha=0.3)
ax.axis('equal')

plt.tight_layout()
plt.show()

print(f'Observations clés:')
print(f'1. Les vecteurs de gradient sont PERPENDICULAIRES aux courbes de niveau')
print(f'2. Les vecteurs pointent VERS LES COURBES PLUS ÉLEVÉES (montée)')
print(f'3. La norme des vecteurs augmente en s\'éloignant du centre')
print(f'4. Au centre (0,0), le gradient est nul (c\'est le minimum)')


### Exercice 5.5 : Dérivées Directionnelles

In [None]:
# Solution 5.5: Dérivées Directionnelles
print('\n\nSOLUTION 5.5: Dérivées Directionnelles')
print('='*70)

# f(x,y) = x² + xy + y²
f = x**2 + x*y + y**2

# Gradient
df_dx = sp.diff(f, x)
df_dy = sp.diff(f, y)

print(f'f(x,y) = {f}')
print(f'∇f = [{df_dx}, {df_dy}]')

# Évaluation en (1, 2)
point = {x: 1, y: 2}
grad_x_val = float(df_dx.subs(point))
grad_y_val = float(df_dy.subs(point))
grad = np.array([grad_x_val, grad_y_val])

print(f'\nEn (1,2): ∇f = {grad}')

# Différentes directions
directions = {
    'axe x': np.array([1, 0]),
    'axe y': np.array([0, 1]),
    'diagonale': np.array([1, 1]) / np.sqrt(2)
}

print(f'\nDérivées directionnelles: D_u f = ∇f · u')
for name, direction in directions.items():
    # Normalisation
    u = direction / np.linalg.norm(direction)
    # Dérivée directionnelle = produit scalaire
    d_u = np.dot(grad, u)
    print(f'\nDirection {name}: u = {u}')
    print(f'D_u f(1,2) = ∇f · u = {d_u:.4f}')


### Exercice 5.6 : Régression Linéaire par Gradient Descent

In [None]:
# Solution 5.6: Régression Linéaire par Gradient Descent
print('\n\nSOLUTION 5.6: Régression Linéaire par Gradient Descent')
print('='*70)

# Données
x_data = np.array([1, 2, 3])
y_data = np.array([2, 4, 5])
n = len(x_data)

# Modèle: ŷ = wx + b
# Loss: L = (1/n) * Σ(y_i - (w*x_i + b))²

def loss_function(w, b):
    y_pred = w * x_data + b
    return np.mean((y_data - y_pred)**2)

def gradient(w, b):
    y_pred = w * x_data + b
    residuals = y_data - y_pred
    dL_dw = -2 * np.mean(residuals * x_data)
    dL_db = -2 * np.mean(residuals)
    return dL_dw, dL_db

# Gradient Descent
w, b = 0.0, 0.0
alpha = 0.01
iterations = 100

losses = []
weights = []
biases = []

print(f'Données: x={list(x_data)}, y={list(y_data)}')
print(f'\nModèle: ŷ = wx + b')
print(f'Loss: L = (1/{n}) * Σ(y_i - ŷ_i)²')
print(f'\nParamètres:')
print(f'Learning rate α = {alpha}')
print(f'Itérations: {iterations}')

for i in range(iterations):
    dL_dw, dL_db = gradient(w, b)
    w -= alpha * dL_dw
    b -= alpha * dL_db
    loss = loss_function(w, b)
    losses.append(loss)
    weights.append(w)
    biases.append(b)
    if (i + 1) % 20 == 0:
        print(f'Itération {i+1:3d}: w={w:.4f}, b={b:.4f}, Loss={loss:.6f}')

print(f'\nRésultats finaux:')
print(f'w = {w:.6f}')
print(f'b = {b:.6f}')
print(f'Droite: ŷ = {w:.4f}x + {b:.4f}')

# Solution analytique (régression linéaire)
x_mean = np.mean(x_data)
y_mean = np.mean(y_data)
w_analytical = np.sum((x_data - x_mean) * (y_data - y_mean)) / np.sum((x_data - x_mean)**2)
b_analytical = y_mean - w_analytical * x_mean

print(f'\nSolution analytique (régression linéaire):')
print(f'w = {w_analytical:.6f}')
print(f'b = {b_analytical:.6f}')
print(f'Droite: ŷ = {w_analytical:.4f}x + {b_analytical:.4f}')

# Visualisation
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Données et droite de régression
ax1 = axes[0]
ax1.scatter(x_data, y_data, s=100, color='red', label='Données', zorder=3)
x_line = np.linspace(0, 4, 100)
y_line_gd = w * x_line + b
y_line_analytical = w_analytical * x_line + b_analytical
ax1.plot(x_line, y_line_gd, 'b-', linewidth=2, label=f'GD: ŷ={w:.4f}x+{b:.4f}')
ax1.plot(x_line, y_line_analytical, 'g--', linewidth=2, label=f'Ana: ŷ={w_analytical:.4f}x+{b_analytical:.4f}')
ax1.set_xlabel('x', fontsize=11)
ax1.set_ylabel('y', fontsize=11)
ax1.set_title('Régression Linéaire', fontsize=12)
ax1.legend(fontsize=10)
ax1.grid(True, alpha=0.3)

# Loss vs iteration
ax2 = axes[1]
ax2.semilogy(range(iterations), losses, 'b-', linewidth=2)
ax2.set_xlabel('Itération', fontsize=11)
ax2.set_ylabel('Loss (échelle log)', fontsize=11)
ax2.set_title('Convergence de la Loss', fontsize=12)
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print(f'\n✓ Les deux méthodes convergent vers la même solution!')


---
## 🎉 Félicitations !

**Vous avez toutes les solutions pour les Sections 4 et 5 !**

### 💡 Conseils

- Refaites les exercices difficiles
- Pratiquez avec vos propres exemples
- Comprenez POURQUOI, pas seulement COMMENT

### 🚀 Prochaines Étapes

1. Sections 6 et 7 (Règle de la Chaîne et Optimisation)
2. Projet: Visualisation de Gradients
3. Algèbre Linéaire

**Excellent travail! 💪**