# üöÄ Google Colab Setup

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/ogautier1980/sandbox-ml/blob/main/cours/XX_CHAPTER/XX_NOTEBOOK.ipynb)

**Si vous ex√©cutez ce notebook sur Google Colab**, ex√©cutez la cellule suivante pour installer les d√©pendances.

In [None]:
# Installation des d√©pendances (Google Colab uniquement)import sysIN_COLAB = 'google.colab' in sys.modulesif IN_COLAB:    print('üì¶ Installation des packages...')        # Packages ML de base    !pip install -q numpy pandas matplotlib seaborn scikit-learn        # D√©tection du chapitre et installation des d√©pendances sp√©cifiques    notebook_name = '01_demo_algebre_lineaire.ipynb'  # Sera remplac√© automatiquement        # Ch 06-08 : Deep Learning    if any(x in notebook_name for x in ['06_', '07_', '08_']):        !pip install -q torch torchvision torchaudio        # Ch 08 : NLP    if '08_' in notebook_name:        !pip install -q transformers datasets tokenizers        if 'rag' in notebook_name:            !pip install -q sentence-transformers faiss-cpu rank-bm25        # Ch 09 : Reinforcement Learning    if '09_' in notebook_name:        !pip install -q gymnasium[classic-control]        # Ch 04 : Boosting    if '04_' in notebook_name and 'boosting' in notebook_name:        !pip install -q xgboost lightgbm catboost        # Ch 05 : Clustering avanc√©    if '05_' in notebook_name:        !pip install -q umap-learn        # Ch 11 : S√©ries temporelles    if '11_' in notebook_name:        !pip install -q statsmodels prophet        # Ch 12 : Vision avanc√©e    if '12_' in notebook_name:        !pip install -q ultralytics timm segmentation-models-pytorch        # Ch 13 : Recommandation    if '13_' in notebook_name:        !pip install -q scikit-surprise implicit        # Ch 14 : MLOps    if '14_' in notebook_name:        !pip install -q mlflow fastapi pydantic        print('‚úÖ Installation termin√©e !')else:    print('‚ÑπÔ∏è  Environnement local d√©tect√©, les packages sont d√©j√† install√©s.')

# Chapitre 01 - D√©monstration : Alg√®bre Lin√©aire

Ce notebook illustre les concepts d'alg√®bre lin√©aire essentiels au Machine Learning :
- Vecteurs, matrices et op√©rations
- Valeurs propres et vecteurs propres
- SVD (Singular Value Decomposition)
- Applications pratiques

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.patches import FancyArrowPatch
from mpl_toolkits.mplot3d import Axes3D
import seaborn as sns

sns.set_style('whitegrid')
plt.rcParams['figure.figsize'] = (10, 6)

## 1. Vecteurs et Op√©rations de Base

In [None]:
# D√©finir des vecteurs
u = np.array([3, 4])
v = np.array([1, 2])

print("Vecteur u:", u)
print("Vecteur v:", v)

# Produit scalaire
dot_product = np.dot(u, v)
print(f"\nProduit scalaire u¬∑v = {dot_product}")

# Normes
norm_l1 = np.linalg.norm(u, ord=1)
norm_l2 = np.linalg.norm(u, ord=2)
norm_linf = np.linalg.norm(u, ord=np.inf)

print(f"\nNormes de u:")
print(f"  L1 (Manhattan): {norm_l1}")
print(f"  L2 (Euclidienne): {norm_l2}")
print(f"  L‚àû (Max): {norm_linf}")

# Distance euclidienne
distance = np.linalg.norm(u - v)
print(f"\nDistance euclidienne entre u et v: {distance:.3f}")

In [None]:
# Visualiser les vecteurs
fig, ax = plt.subplots(figsize=(8, 8))

# Tracer les vecteurs
ax.quiver(0, 0, u[0], u[1], angles='xy', scale_units='xy', scale=1, 
          color='blue', width=0.008, label='u')
ax.quiver(0, 0, v[0], v[1], angles='xy', scale_units='xy', scale=1, 
          color='red', width=0.008, label='v')
ax.quiver(0, 0, (u+v)[0], (u+v)[1], angles='xy', scale_units='xy', scale=1, 
          color='green', width=0.008, linestyle='--', label='u+v')

ax.set_xlim(-1, 6)
ax.set_ylim(-1, 7)
ax.set_aspect('equal')
ax.grid(True, alpha=0.3)
ax.legend(fontsize=12)
ax.set_xlabel('x‚ÇÅ', fontsize=12)
ax.set_ylabel('x‚ÇÇ', fontsize=12)
ax.set_title('Vecteurs et Addition Vectorielle', fontsize=14)
plt.show()

## 2. Matrices et Multiplication Matricielle

In [None]:
# Cr√©er des matrices
A = np.array([[2, 1],
              [1, 3]])

B = np.array([[1, 0],
              [0, 2]])

print("Matrice A:")
print(A)
print("\nMatrice B:")
print(B)

# Op√©rations matricielles
C = A @ B  # Multiplication matricielle
print("\nA @ B:")
print(C)

# Attention : A @ B ‚â† B @ A en g√©n√©ral
D = B @ A
print("\nB @ A:")
print(D)
print("\nA @ B == B @ A?", np.allclose(C, D))

In [None]:
# Propri√©t√©s matricielles
print("Transpos√©e de A:")
print(A.T)

print("\nD√©terminant de A:", np.linalg.det(A))
print("Trace de A:", np.trace(A))
print("Rang de A:", np.linalg.matrix_rank(A))

# Inverse
A_inv = np.linalg.inv(A)
print("\nInverse de A:")
print(A_inv)

# V√©rification : A @ A_inv = I
I = A @ A_inv
print("\nA @ A‚Åª¬π (devrait √™tre proche de I):")
print(I)

## 3. Valeurs Propres et Vecteurs Propres

In [None]:
# Calculer valeurs propres et vecteurs propres
A = np.array([[4, 2],
              [1, 3]])

eigenvalues, eigenvectors = np.linalg.eig(A)

print("Matrice A:")
print(A)
print("\nValeurs propres Œª:")
print(eigenvalues)
print("\nVecteurs propres (colonnes):")
print(eigenvectors)

# V√©rification : A @ v = Œª @ v
for i in range(len(eigenvalues)):
    v = eigenvectors[:, i]
    lam = eigenvalues[i]
    
    Av = A @ v
    lam_v = lam * v
    
    print(f"\nV√©rification pour Œª{i+1} = {lam:.3f}:")
    print(f"  A @ v = {Av}")
    print(f"  Œª @ v = {lam_v}")
    print(f"  √âgaux? {np.allclose(Av, lam_v)}")

In [None]:
# Visualiser les vecteurs propres et transformation
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 7))

# Avant transformation
for i in range(2):
    v = eigenvectors[:, i]
    ax1.quiver(0, 0, v[0], v[1], angles='xy', scale_units='xy', scale=1,
               color=['blue', 'red'][i], width=0.01, label=f'v{i+1}')

ax1.set_xlim(-1, 1)
ax1.set_ylim(-1, 1)
ax1.set_aspect('equal')
ax1.grid(True, alpha=0.3)
ax1.legend()
ax1.set_title('Vecteurs Propres', fontsize=14)

# Apr√®s transformation A @ v = Œªv
for i in range(2):
    v = eigenvectors[:, i]
    lam = eigenvalues[i]
    Av = A @ v
    
    # Vecteur original
    ax2.quiver(0, 0, v[0], v[1], angles='xy', scale_units='xy', scale=1,
               color=['blue', 'red'][i], width=0.005, alpha=0.3)
    # Vecteur transform√©
    ax2.quiver(0, 0, Av[0], Av[1], angles='xy', scale_units='xy', scale=1,
               color=['blue', 'red'][i], width=0.01, 
               label=f'A@v{i+1} = {lam:.2f}*v{i+1}')

ax2.set_xlim(-1, 3)
ax2.set_ylim(-1, 3)
ax2.set_aspect('equal')
ax2.grid(True, alpha=0.3)
ax2.legend()
ax2.set_title('Transformation par A (√©tirement le long des vecteurs propres)', fontsize=14)

plt.tight_layout()
plt.show()

## 4. D√©composition SVD (Singular Value Decomposition)

In [None]:
# Cr√©er une matrice rectangulaire
A = np.array([[3, 1],
              [1, 3],
              [1, 1]])

print("Matrice A (3√ó2):")
print(A)

# SVD : A = U @ Sigma @ V^T
U, Sigma, VT = np.linalg.svd(A, full_matrices=False)

print("\nDimensions:")
print(f"  U: {U.shape}")
print(f"  Sigma: {Sigma.shape}")
print(f"  V^T: {VT.shape}")

print("\nValeurs singuli√®res:")
print(Sigma)

# Reconstruction
Sigma_mat = np.diag(Sigma)
A_reconstructed = U @ Sigma_mat @ VT

print("\nMatrice reconstruite A = U @ Œ£ @ V^T:")
print(A_reconstructed)
print("\nErreur de reconstruction:", np.linalg.norm(A - A_reconstructed))

In [None]:
# Application : approximation de rang faible
# Cr√©er une image synth√©tique
np.random.seed(42)
img = np.random.randn(50, 50)
img = img + img.T  # Rendre sym√©trique pour plus de structure

# SVD
U, Sigma, VT = np.linalg.svd(img, full_matrices=False)

# Approximations de rang k
ranks = [1, 5, 10, 20, 50]
fig, axes = plt.subplots(1, len(ranks), figsize=(18, 4))

for ax, k in zip(axes, ranks):
    # Garder seulement les k premi√®res valeurs singuli√®res
    Sigma_k = Sigma.copy()
    Sigma_k[k:] = 0
    
    # Reconstruction
    img_k = U @ np.diag(Sigma_k) @ VT
    
    # Afficher
    ax.imshow(img_k, cmap='viridis')
    ax.set_title(f'Rang k={k}', fontsize=12)
    ax.axis('off')

plt.suptitle('Approximation de Rang Faible via SVD', fontsize=14)
plt.tight_layout()
plt.show()

# √ânergie captur√©e
total_energy = np.sum(Sigma**2)
cumulative_energy = np.cumsum(Sigma**2) / total_energy

plt.figure(figsize=(10, 5))
plt.plot(range(1, len(cumulative_energy)+1), cumulative_energy, 'b-o', markersize=4)
plt.axhline(y=0.9, color='r', linestyle='--', label='90% √©nergie')
plt.axhline(y=0.95, color='g', linestyle='--', label='95% √©nergie')
plt.xlabel('Nombre de composantes', fontsize=12)
plt.ylabel('√ânergie cumulative (fraction)', fontsize=12)
plt.title('√ânergie Captur√©e par les Composantes SVD', fontsize=14)
plt.grid(True, alpha=0.3)
plt.legend()
plt.show()

## 5. Application ML : R√©gression Lin√©aire avec Moindres Carr√©s

In [None]:
# G√©n√©rer des donn√©es synth√©tiques
np.random.seed(42)
n_samples = 100
X = np.random.randn(n_samples, 1) * 2
y = 3 * X.squeeze() + 2 + np.random.randn(n_samples) * 0.5

# Ajouter une colonne de 1 pour le biais
X_with_bias = np.c_[np.ones(n_samples), X]

print("Forme de X (avec biais):", X_with_bias.shape)
print("Forme de y:", y.shape)

# Solution analytique : w = (X^T X)^(-1) X^T y
w_optimal = np.linalg.inv(X_with_bias.T @ X_with_bias) @ X_with_bias.T @ y

print("\nParam√®tres optimaux (m√©thode normale):")
print(f"  Biais (intercept): {w_optimal[0]:.3f}")
print(f"  Pente (coefficient): {w_optimal[1]:.3f}")

# Alternative : utiliser la pseudo-inverse
X_pinv = np.linalg.pinv(X_with_bias)
w_pinv = X_pinv @ y
print("\nParam√®tres (pseudo-inverse):")
print(f"  Biais: {w_pinv[0]:.3f}")
print(f"  Pente: {w_pinv[1]:.3f}")

In [None]:
# Visualiser
plt.figure(figsize=(10, 6))
plt.scatter(X, y, alpha=0.6, label='Donn√©es')

# Ligne de r√©gression
X_line = np.linspace(X.min(), X.max(), 100).reshape(-1, 1)
X_line_with_bias = np.c_[np.ones(len(X_line)), X_line]
y_pred = X_line_with_bias @ w_optimal

plt.plot(X_line, y_pred, 'r-', linewidth=2, 
         label=f'y = {w_optimal[1]:.2f}x + {w_optimal[0]:.2f}')

plt.xlabel('x', fontsize=12)
plt.ylabel('y', fontsize=12)
plt.title('R√©gression Lin√©aire - Solution par Moindres Carr√©s', fontsize=14)
plt.legend(fontsize=11)
plt.grid(True, alpha=0.3)
plt.show()

# Calculer l'erreur MSE
y_pred_train = X_with_bias @ w_optimal
mse = np.mean((y - y_pred_train)**2)
print(f"\nMean Squared Error: {mse:.4f}")

## 6. Application : PCA (Principal Component Analysis) avec SVD

In [None]:
# G√©n√©rer des donn√©es 2D corr√©l√©es
np.random.seed(42)
n = 200

# Donn√©es originales
X_original = np.random.randn(n, 2)

# Rotation et √©tirement
angle = np.pi / 4
rotation = np.array([[np.cos(angle), -np.sin(angle)],
                      [np.sin(angle), np.cos(angle)]])
scaling = np.array([[3, 0], [0, 1]])
transform = rotation @ scaling

X = (transform @ X_original.T).T

# Centrer les donn√©es
X_centered = X - X.mean(axis=0)

# PCA via SVD
U, Sigma, VT = np.linalg.svd(X_centered, full_matrices=False)

# Les composantes principales sont dans VT
principal_components = VT.T

print("Composantes principales:")
print(principal_components)
print("\nVariance expliqu√©e (valeurs singuli√®res au carr√©):")
variance_explained = (Sigma**2) / (n - 1)
print(variance_explained)
print("\nProportion de variance expliqu√©e:")
print(variance_explained / variance_explained.sum())

In [None]:
# Visualiser PCA
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 7))

# Donn√©es originales + composantes principales
ax1.scatter(X_centered[:, 0], X_centered[:, 1], alpha=0.5)

# Tracer les composantes principales
mean = X.mean(axis=0)
for i in range(2):
    pc = principal_components[:, i] * Sigma[i] / 2
    ax1.arrow(0, 0, pc[0], pc[1], head_width=0.3, head_length=0.4,
              fc=['red', 'blue'][i], ec=['red', 'blue'][i], linewidth=2,
              label=f'PC{i+1} ({variance_explained[i]/variance_explained.sum()*100:.1f}%)')

ax1.set_aspect('equal')
ax1.grid(True, alpha=0.3)
ax1.legend(fontsize=11)
ax1.set_title('Donn√©es Originales + Composantes Principales', fontsize=14)
ax1.set_xlabel('x‚ÇÅ', fontsize=12)
ax1.set_ylabel('x‚ÇÇ', fontsize=12)

# Donn√©es projet√©es sur les composantes principales
X_pca = X_centered @ principal_components
ax2.scatter(X_pca[:, 0], X_pca[:, 1], alpha=0.5)
ax2.set_aspect('equal')
ax2.grid(True, alpha=0.3)
ax2.set_title('Donn√©es dans l\'Espace PCA', fontsize=14)
ax2.set_xlabel('PC1', fontsize=12)
ax2.set_ylabel('PC2', fontsize=12)

plt.tight_layout()
plt.show()

## R√©sum√©

Dans ce notebook, nous avons vu :

1. **Op√©rations vectorielles** : produit scalaire, normes, distances
2. **Matrices** : multiplication, transpos√©e, inverse, d√©terminant
3. **Valeurs/vecteurs propres** : d√©composition spectrale, transformations lin√©aires
4. **SVD** : d√©composition universelle, approximation de rang faible
5. **Application ML** : r√©gression lin√©aire par moindres carr√©s
6. **PCA** : r√©duction de dimensionnalit√© via SVD

Ces concepts sont **fondamentaux** pour comprendre les algorithmes de ML !