# üìê Chapitre 04 : Alg√®bre Lin√©aire Avanc√©e

Bienvenue dans le chapitre sur l'alg√®bre lin√©aire avanc√©e ! üöÄ

## üéØ Objectifs du Chapitre

√Ä la fin de ce chapitre, tu seras capable de :

- ‚úÖ Comprendre les **espaces vectoriels** et **sous-espaces**
- ‚úÖ Analyser l'**ind√©pendance lin√©aire** et les **bases**
- ‚úÖ Calculer le **rang** d'une matrice
- ‚úÖ Ma√Ætriser les **valeurs propres** et **vecteurs propres** (eigenvalues/eigenvectors)
- ‚úÖ Appliquer la **d√©composition SVD** (Singular Value Decomposition)
- ‚úÖ Utiliser **PCA** (Principal Component Analysis) pour la r√©duction de dimension

## üî• Pourquoi c'est CRUCIAL en ML ?

L'alg√®bre lin√©aire avanc√©e est **le c≈ìur battant** du Machine Learning :

- üß† **Deep Learning** : Les r√©seaux de neurones sont des transformations lin√©aires compos√©es
- üìä **PCA** : R√©duction de dimension pour visualiser et acc√©l√©rer les mod√®les
- üé® **SVD** : Compression d'images, syst√®mes de recommandation (Netflix !)
- üîç **Eigenvalues** : Analyse de stabilit√©, PageRank de Google
- üí∞ **Finance Quantitative** : Analyse de corr√©lations, gestion de portefeuille

---

## üìö Table des Mati√®res

1. [Espaces Vectoriels et Sous-Espaces](#1-espaces-vectoriels)
2. [Ind√©pendance Lin√©aire et Base](#2-independance-lineaire)
3. [Rang d'une Matrice](#3-rang-matrice)
4. [Valeurs Propres et Vecteurs Propres](#4-valeurs-propres)
5. [D√©composition SVD](#5-svd)
6. [PCA - Principal Component Analysis](#6-pca)
7. [Applications en Finance Quantitative](#7-applications-finance)

---

In [None]:
# üì¶ Imports n√©cessaires
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from scipy import linalg
import seaborn as sns

# Configuration pour de beaux graphiques
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette("husl")

print("‚úÖ Imports r√©ussis !")
print(f"üìå NumPy version: {np.__version__}")

---

## 1Ô∏è‚É£ Espaces Vectoriels et Sous-Espaces <a id="1-espaces-vectoriels"></a>

### üìñ Th√©orie

#### Espace Vectoriel

Un **espace vectoriel** $V$ est un ensemble de vecteurs o√π on peut :
- ‚ûï **Additionner** deux vecteurs : $\vec{u} + \vec{v} \in V$
- ‚úñÔ∏è **Multiplier** par un scalaire : $\alpha \vec{v} \in V$

**Exemples** :
- $\mathbb{R}^2$ : tous les vecteurs 2D
- $\mathbb{R}^3$ : tous les vecteurs 3D
- $\mathbb{R}^n$ : tous les vecteurs n-dimensionnels

#### Sous-Espace Vectoriel

Un **sous-espace** $W \subseteq V$ est un sous-ensemble de $V$ qui est lui-m√™me un espace vectoriel.

**Conditions** :
1. Contient le vecteur nul : $\vec{0} \in W$
2. Ferm√© par addition : $\vec{u}, \vec{v} \in W \Rightarrow \vec{u} + \vec{v} \in W$
3. Ferm√© par multiplication scalaire : $\vec{v} \in W, \alpha \in \mathbb{R} \Rightarrow \alpha\vec{v} \in W$

**Exemples en $\mathbb{R}^3$** :
- Une **ligne** passant par l'origine (sous-espace 1D)
- Un **plan** passant par l'origine (sous-espace 2D)
- L'espace entier $\mathbb{R}^3$ (sous-espace 3D)

### üî• CRUCIAL en ML

- **Feature spaces** : Les donn√©es vivent dans des espaces vectoriels
- **Subspaces** : PCA trouve les sous-espaces les plus informatifs
- **Null space** : Solutions √† $A\vec{x} = \vec{0}$ forment un sous-espace

In [None]:
# üé® Visualisation : Sous-espaces dans R¬≥

fig = plt.figure(figsize=(15, 5))

# Sous-espace 1D : une ligne
ax1 = fig.add_subplot(131, projection='3d')
t = np.linspace(-2, 2, 100)
direction = np.array([1, 2, 1])
line = np.outer(t, direction)

ax1.plot(line[:, 0], line[:, 1], line[:, 2], 'b-', linewidth=2, label='Ligne (1D)')
ax1.scatter([0], [0], [0], color='red', s=100, label='Origine')
ax1.set_xlabel('X')
ax1.set_ylabel('Y')
ax1.set_zlabel('Z')
ax1.set_title('Sous-espace 1D\nLigne passant par l\'origine')
ax1.legend()
ax1.set_xlim([-2, 2])
ax1.set_ylim([-2, 2])
ax1.set_zlim([-2, 2])

# Sous-espace 2D : un plan
ax2 = fig.add_subplot(132, projection='3d')
x = np.linspace(-2, 2, 10)
y = np.linspace(-2, 2, 10)
X, Y = np.meshgrid(x, y)
Z = 0.5 * X + 0.3 * Y  # Plan d√©fini par deux vecteurs

ax2.plot_surface(X, Y, Z, alpha=0.5, cmap='viridis')
ax2.scatter([0], [0], [0], color='red', s=100, label='Origine')
ax2.set_xlabel('X')
ax2.set_ylabel('Y')
ax2.set_zlabel('Z')
ax2.set_title('Sous-espace 2D\nPlan passant par l\'origine')
ax2.legend()

# Espace complet R¬≥
ax3 = fig.add_subplot(133, projection='3d')
# Quelques vecteurs dans R¬≥
vectors = np.random.randn(20, 3) * 2
for v in vectors:
    ax3.quiver(0, 0, 0, v[0], v[1], v[2], arrow_length_ratio=0.1, alpha=0.6)
ax3.scatter([0], [0], [0], color='red', s=100, label='Origine')
ax3.set_xlabel('X')
ax3.set_ylabel('Y')
ax3.set_zlabel('Z')
ax3.set_title('Espace complet R¬≥\nTous les vecteurs 3D')
ax3.legend()

plt.tight_layout()
plt.show()

print("üìä Dimension du sous-espace = nombre de directions ind√©pendantes")

---

## 2Ô∏è‚É£ Ind√©pendance Lin√©aire et Base <a id="2-independance-lineaire"></a>

### üìñ Th√©orie

#### Ind√©pendance Lin√©aire

Des vecteurs $\vec{v_1}, \vec{v_2}, ..., \vec{v_n}$ sont **lin√©airement ind√©pendants** si :

$$\alpha_1 \vec{v_1} + \alpha_2 \vec{v_2} + ... + \alpha_n \vec{v_n} = \vec{0} \quad \Rightarrow \quad \alpha_1 = \alpha_2 = ... = \alpha_n = 0$$

En d'autres termes : **aucun vecteur ne peut s'√©crire comme combinaison des autres**.

**Exemples** :
- ‚úÖ $\vec{v_1} = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$, $\vec{v_2} = \begin{bmatrix} 0 \\ 1 \end{bmatrix}$ sont ind√©pendants
- ‚ùå $\vec{v_1} = \begin{bmatrix} 1 \\ 2 \end{bmatrix}$, $\vec{v_2} = \begin{bmatrix} 2 \\ 4 \end{bmatrix}$ sont d√©pendants ($\vec{v_2} = 2\vec{v_1}$)

#### Base d'un Espace Vectoriel

Une **base** de $V$ est un ensemble de vecteurs qui sont :
1. **Lin√©airement ind√©pendants**
2. **Engendrent tout l'espace** : tout vecteur de $V$ peut s'√©crire comme combinaison lin√©aire des vecteurs de la base

**Base standard de $\mathbb{R}^3$** :
$$\vec{e_1} = \begin{bmatrix} 1 \\ 0 \\ 0 \end{bmatrix}, \quad \vec{e_2} = \begin{bmatrix} 0 \\ 1 \\ 0 \end{bmatrix}, \quad \vec{e_3} = \begin{bmatrix} 0 \\ 0 \\ 1 \end{bmatrix}$$

#### Dimension

La **dimension** d'un espace vectoriel = **nombre de vecteurs dans une base**.

- $\dim(\mathbb{R}^2) = 2$
- $\dim(\mathbb{R}^3) = 3$
- $\dim(\mathbb{R}^n) = n$

### üî• CRUCIAL en ML

- **Feature selection** : Enlever les features d√©pendantes (redondantes)
- **PCA** : Trouve une nouvelle base plus informative
- **Dimensionality** : Nombre de param√®tres ind√©pendants dans un mod√®le

In [None]:
# üîç Test d'ind√©pendance lin√©aire avec NumPy

def test_linear_independence(vectors):
    """
    Teste si des vecteurs sont lin√©airement ind√©pendants.
    
    M√©thode : on forme une matrice et on regarde son rang.
    Si rang = nombre de vecteurs ‚Üí ind√©pendants
    Sinon ‚Üí d√©pendants
    """
    A = np.column_stack(vectors)
    rank = np.linalg.matrix_rank(A)
    n_vectors = len(vectors)
    
    print(f"Matrice form√©e :")
    print(A)
    print(f"\nRang : {rank}")
    print(f"Nombre de vecteurs : {n_vectors}")
    
    if rank == n_vectors:
        print("‚úÖ Les vecteurs sont LIN√âAIREMENT IND√âPENDANTS")
        return True
    else:
        print("‚ùå Les vecteurs sont LIN√âAIREMENT D√âPENDANTS")
        print(f"   ‚Üí Seulement {rank} vecteurs ind√©pendants parmi {n_vectors}")
        return False

# Exemple 1 : Vecteurs ind√©pendants
print("="*50)
print("Exemple 1 : Base standard de R¬≤")
print("="*50)
v1 = np.array([1, 0])
v2 = np.array([0, 1])
test_linear_independence([v1, v2])

print("\n" + "="*50)
print("Exemple 2 : Vecteurs d√©pendants")
print("="*50)
v1 = np.array([1, 2])
v2 = np.array([2, 4])  # v2 = 2*v1
test_linear_independence([v1, v2])

print("\n" + "="*50)
print("Exemple 3 : Trois vecteurs dans R¬≥")
print("="*50)
v1 = np.array([1, 0, 0])
v2 = np.array([0, 1, 0])
v3 = np.array([0, 0, 1])
test_linear_independence([v1, v2, v3])

In [None]:
# üé® Visualisation : Ind√©pendance vs D√©pendance

fig, axes = plt.subplots(1, 2, figsize=(14, 6))

# Cas 1 : Vecteurs ind√©pendants
ax = axes[0]
v1 = np.array([2, 1])
v2 = np.array([1, 3])

ax.quiver(0, 0, v1[0], v1[1], angles='xy', scale_units='xy', scale=1, 
          color='blue', width=0.01, label='v‚ÇÅ')
ax.quiver(0, 0, v2[0], v2[1], angles='xy', scale_units='xy', scale=1, 
          color='red', width=0.01, label='v‚ÇÇ')

# Montrer qu'on peut atteindre n'importe quel point
for a in np.linspace(-1, 1, 5):
    for b in np.linspace(-1, 1, 5):
        point = a * v1 + b * v2
        ax.scatter(point[0], point[1], alpha=0.3, s=20, color='green')

ax.set_xlim(-4, 4)
ax.set_ylim(-4, 4)
ax.axhline(y=0, color='k', linewidth=0.5)
ax.axvline(x=0, color='k', linewidth=0.5)
ax.grid(True, alpha=0.3)
ax.legend()
ax.set_title('‚úÖ Vecteurs IND√âPENDANTS\nPeuvent engendrer tout le plan', fontsize=12, fontweight='bold')
ax.set_xlabel('x')
ax.set_ylabel('y')

# Cas 2 : Vecteurs d√©pendants
ax = axes[1]
v1 = np.array([2, 1])
v2 = np.array([4, 2])  # v2 = 2*v1

ax.quiver(0, 0, v1[0], v1[1], angles='xy', scale_units='xy', scale=1, 
          color='blue', width=0.01, label='v‚ÇÅ')
ax.quiver(0, 0, v2[0], v2[1], angles='xy', scale_units='xy', scale=1, 
          color='red', width=0.01, label='v‚ÇÇ = 2v‚ÇÅ')

# Ne peuvent engendrer qu'une ligne
t = np.linspace(-2, 2, 100)
line = np.outer(t, v1)
ax.plot(line[:, 0], line[:, 1], 'g--', alpha=0.5, linewidth=2, label='Sous-espace engendr√©')

ax.set_xlim(-4, 4)
ax.set_ylim(-4, 4)
ax.axhline(y=0, color='k', linewidth=0.5)
ax.axvline(x=0, color='k', linewidth=0.5)
ax.grid(True, alpha=0.3)
ax.legend()
ax.set_title('‚ùå Vecteurs D√âPENDANTS\nN\'engendrent qu\'une ligne', fontsize=12, fontweight='bold')
ax.set_xlabel('x')
ax.set_ylabel('y')

plt.tight_layout()
plt.show()

---

## 3Ô∏è‚É£ Rang d'une Matrice <a id="3-rang-matrice"></a>

### üìñ Th√©orie

Le **rang** d'une matrice $A$ est le **nombre maximal de colonnes (ou lignes) lin√©airement ind√©pendantes**.

$$\text{rang}(A) = \dim(\text{espace des colonnes}) = \dim(\text{espace des lignes})$$

**Propri√©t√©s** :
- $\text{rang}(A) \leq \min(m, n)$ pour une matrice $m \times n$
- $\text{rang}(A) = \text{rang}(A^T)$
- Si $\text{rang}(A) = n$ (matrice $n \times n$), alors $A$ est **inversible** (rang plein)
- Si $\text{rang}(A) < n$, alors $A$ est **singuli√®re** (non inversible)

**Interpr√©tation g√©om√©trique** :
- Rang 1 : Tous les vecteurs colonnes sont colin√©aires ‚Üí g√©n√®rent une ligne
- Rang 2 : Les colonnes g√©n√®rent un plan
- Rang 3 : Les colonnes g√©n√®rent l'espace 3D complet

### üî• CRUCIAL en ML

- **Multicollin√©arit√©** : D√©tecter les features redondantes
- **SVD** : Approximation de rang faible pour compression
- **Matrix completion** : Syst√®mes de recommandation (Netflix)
- **Regularization** : √âviter les matrices singuli√®res

In [None]:
# üîç Calcul du rang avec NumPy

def analyze_rank(A, name="Matrice"):
    """Analyse compl√®te du rang d'une matrice."""
    m, n = A.shape
    rank = np.linalg.matrix_rank(A)
    
    print(f"\n{'='*60}")
    print(f"{name}")
    print(f"{'='*60}")
    print(A)
    print(f"\nDimension : {m} √ó {n}")
    print(f"Rang : {rank}")
    print(f"Rang maximum possible : {min(m, n)}")
    
    if rank == min(m, n):
        print("‚úÖ Rang PLEIN (full rank)")
        if m == n:
            print("   ‚Üí Matrice INVERSIBLE")
    else:
        print(f"‚ùå Rang D√âFICIENT (rank deficient)")
        print(f"   ‚Üí Manque {min(m, n) - rank} dimension(s)")
        if m == n:
            print("   ‚Üí Matrice NON INVERSIBLE (singuli√®re)")
    
    return rank

# Exemple 1 : Matrice de rang plein
A1 = np.array([[1, 2],
               [3, 4]])
analyze_rank(A1, "Exemple 1 : Matrice 2√ó2 inversible")

# Exemple 2 : Matrice singuli√®re (rang d√©ficient)
A2 = np.array([[1, 2],
               [2, 4]])  # Ligne 2 = 2 √ó Ligne 1
analyze_rank(A2, "Exemple 2 : Matrice 2√ó2 singuli√®re")

# Exemple 3 : Matrice rectangulaire
A3 = np.array([[1, 2, 3],
               [4, 5, 6]])
analyze_rank(A3, "Exemple 3 : Matrice 2√ó3")

# Exemple 4 : Matrice de rang 1
u = np.array([[1], [2], [3]])
v = np.array([[1, 2, 4]])
A4 = u @ v  # Produit ext√©rieur ‚Üí rang 1
analyze_rank(A4, "Exemple 4 : Matrice de rang 1 (produit ext√©rieur)")

In [None]:
# üé® Visualisation : Impact du rang sur la transformation

fig, axes = plt.subplots(1, 3, figsize=(18, 5))

# Grille de points dans R¬≤
x = np.linspace(-2, 2, 20)
y = np.linspace(-2, 2, 20)
X, Y = np.meshgrid(x, y)
points = np.vstack([X.ravel(), Y.ravel()])

# Matrice rang 2 (inversible)
A_rank2 = np.array([[2, 1],
                     [1, 2]])
transformed_rank2 = A_rank2 @ points

axes[0].scatter(points[0], points[1], alpha=0.3, s=10, label='Original')
axes[0].scatter(transformed_rank2[0], transformed_rank2[1], alpha=0.3, s=10, 
                color='red', label='Transform√©')
axes[0].set_title(f'Rang 2 (plein)\nL\'espace est pr√©serv√©', fontweight='bold')
axes[0].legend()
axes[0].grid(True, alpha=0.3)
axes[0].set_xlim(-10, 10)
axes[0].set_ylim(-10, 10)
axes[0].set_aspect('equal')

# Matrice rang 1 (singuli√®re)
A_rank1 = np.array([[1, 2],
                     [2, 4]])  # Rang 1
transformed_rank1 = A_rank1 @ points

axes[1].scatter(points[0], points[1], alpha=0.3, s=10, label='Original')
axes[1].scatter(transformed_rank1[0], transformed_rank1[1], alpha=0.3, s=10, 
                color='red', label='Transform√©')
axes[1].set_title(f'Rang 1\nCollapse sur une ligne !', fontweight='bold')
axes[1].legend()
axes[1].grid(True, alpha=0.3)
axes[1].set_xlim(-10, 10)
axes[1].set_ylim(-10, 10)
axes[1].set_aspect('equal')

# Matrice rang 0 (matrice nulle)
A_rank0 = np.zeros((2, 2))
transformed_rank0 = A_rank0 @ points

axes[2].scatter(points[0], points[1], alpha=0.3, s=10, label='Original')
axes[2].scatter(transformed_rank0[0], transformed_rank0[1], alpha=0.3, s=100, 
                color='red', label='Transform√©', marker='x')
axes[2].set_title(f'Rang 0\nCollapse √† l\'origine !', fontweight='bold')
axes[2].legend()
axes[2].grid(True, alpha=0.3)
axes[2].set_xlim(-3, 3)
axes[2].set_ylim(-3, 3)
axes[2].set_aspect('equal')

plt.tight_layout()
plt.show()

print("\nüí° Intuition :")
print("   Rang = Dimension de l'image de la transformation")
print("   Rang faible = Perte d'information")

---

## 4Ô∏è‚É£ Valeurs Propres et Vecteurs Propres <a id="4-valeurs-propres"></a>

### üìñ Th√©orie

#### D√©finition

Pour une matrice carr√©e $A$, un **vecteur propre** $\vec{v}$ et sa **valeur propre** $\lambda$ v√©rifient :

$$A\vec{v} = \lambda \vec{v}$$

**Interpr√©tation** : 
- Le vecteur $\vec{v}$ ne change PAS de direction quand on applique $A$
- Il est seulement **√©tir√©** (ou r√©tr√©ci) par un facteur $\lambda$

#### √âquation Caract√©ristique

Pour trouver les valeurs propres, on r√©sout :

$$\det(A - \lambda I) = 0$$

C'est un **polyn√¥me** de degr√© $n$ qui a $n$ racines (√©ventuellement complexes ou r√©p√©t√©es).

#### Propri√©t√©s Importantes

1. **Trace** : $\sum \lambda_i = \text{tr}(A)$
2. **D√©terminant** : $\prod \lambda_i = \det(A)$
3. **Diagonalisation** : Si $A$ a $n$ vecteurs propres ind√©pendants :
   $$A = PDP^{-1}$$
   o√π $D$ est diagonale (valeurs propres) et $P$ contient les vecteurs propres

### üî• CRUCIAL en ML

- **PCA** : Les vecteurs propres de la matrice de covariance sont les directions principales
- **PageRank** : Le vecteur propre dominant de la matrice de liens web
- **Stabilit√©** : Valeurs propres < 1 ‚Üí syst√®me stable
- **Optimisation** : Analyse de la Hessienne pour trouver minima/maxima
- **Spectral Clustering** : Utilise les vecteurs propres du Laplacien

In [None]:
# üîç Calcul des valeurs et vecteurs propres

def analyze_eigenvalues(A, name="Matrice"):
    """Analyse compl√®te des valeurs/vecteurs propres."""
    print(f"\n{'='*60}")
    print(f"{name}")
    print(f"{'='*60}")
    print(A)
    
    # Calcul
    eigenvalues, eigenvectors = np.linalg.eig(A)
    
    print(f"\nüìä Valeurs propres (Œª) :")
    for i, Œª in enumerate(eigenvalues, 1):
        print(f"   Œª{i} = {Œª:.4f}")
    
    print(f"\nüß≠ Vecteurs propres (normalis√©s) :")
    for i in range(len(eigenvalues)):
        v = eigenvectors[:, i]
        print(f"   v{i+1} = {v}")
    
    # V√©rification
    print(f"\n‚úÖ V√©rification A*v = Œª*v :")
    for i in range(len(eigenvalues)):
        v = eigenvectors[:, i]
        Œª = eigenvalues[i]
        Av = A @ v
        Œªv = Œª * v
        is_close = np.allclose(Av, Œªv)
        symbol = "‚úì" if is_close else "‚úó"
        print(f"   {symbol} Vecteur propre {i+1} : {is_close}")
    
    # Propri√©t√©s
    print(f"\nüìå Propri√©t√©s :")
    print(f"   Trace de A = {np.trace(A):.4f}")
    print(f"   Somme des Œª = {np.sum(eigenvalues):.4f}")
    print(f"   D√©terminant de A = {np.linalg.det(A):.4f}")
    print(f"   Produit des Œª = {np.prod(eigenvalues):.4f}")
    
    return eigenvalues, eigenvectors

# Exemple 1 : Matrice sym√©trique (valeurs propres r√©elles)
A1 = np.array([[4, 2],
               [2, 3]])
Œª1, v1 = analyze_eigenvalues(A1, "Matrice Sym√©trique")

# Exemple 2 : Matrice diagonale (simple !)
A2 = np.array([[5, 0],
               [0, 3]])
Œª2, v2 = analyze_eigenvalues(A2, "Matrice Diagonale")

# Exemple 3 : Matrice de rotation (valeurs propres complexes)
Œ∏ = np.pi / 4  # 45 degr√©s
A3 = np.array([[np.cos(Œ∏), -np.sin(Œ∏)],
               [np.sin(Œ∏), np.cos(Œ∏)]])
Œª3, v3 = analyze_eigenvalues(A3, "Matrice de Rotation (45¬∞)")

In [None]:
# üé® Visualisation : Vecteurs propres comme directions invariantes

# Matrice d'exemple
A = np.array([[3, 1],
              [1, 3]])

eigenvalues, eigenvectors = np.linalg.eig(A)

fig, axes = plt.subplots(1, 2, figsize=(14, 6))

# Avant transformation
ax = axes[0]
# Grille de vecteurs
for i in range(-2, 3):
    for j in range(-2, 3):
        if i != 0 or j != 0:
            v = np.array([i, j])
            ax.arrow(0, 0, v[0], v[1], head_width=0.1, head_length=0.1, 
                    fc='lightblue', ec='blue', alpha=0.3)

# Vecteurs propres en rouge
for i in range(2):
    v = eigenvectors[:, i] * 2
    ax.arrow(0, 0, v[0], v[1], head_width=0.15, head_length=0.15, 
            fc='red', ec='darkred', linewidth=3, alpha=0.8,
            label=f'v{i+1} (Œª={eigenvalues[i]:.2f})')

ax.set_xlim(-3, 3)
ax.set_ylim(-3, 3)
ax.axhline(y=0, color='k', linewidth=0.5)
ax.axvline(x=0, color='k', linewidth=0.5)
ax.grid(True, alpha=0.3)
ax.legend()
ax.set_title('Avant Transformation\nVecteurs propres en rouge', fontweight='bold')
ax.set_aspect('equal')

# Apr√®s transformation
ax = axes[1]
for i in range(-2, 3):
    for j in range(-2, 3):
        if i != 0 or j != 0:
            v = np.array([i, j])
            transformed = A @ v
            ax.arrow(0, 0, transformed[0], transformed[1], 
                    head_width=0.2, head_length=0.2, 
                    fc='lightgreen', ec='green', alpha=0.3)

# Vecteurs propres transform√©s (toujours dans la m√™me direction !)
for i in range(2):
    v = eigenvectors[:, i] * 2
    transformed = A @ v
    ax.arrow(0, 0, transformed[0], transformed[1], 
            head_width=0.3, head_length=0.3, 
            fc='red', ec='darkred', linewidth=3, alpha=0.8,
            label=f'A*v{i+1} (√©tir√© par {eigenvalues[i]:.2f})')

ax.set_xlim(-8, 8)
ax.set_ylim(-8, 8)
ax.axhline(y=0, color='k', linewidth=0.5)
ax.axvline(x=0, color='k', linewidth=0.5)
ax.grid(True, alpha=0.3)
ax.legend()
ax.set_title('Apr√®s Transformation A\nVecteurs propres gardent leur direction !', 
             fontweight='bold')
ax.set_aspect('equal')

plt.tight_layout()
plt.show()

print("\nüí° Intuition :")
print("   Les vecteurs propres sont les AXES NATURELS de la transformation !")
print("   Dans leur direction, la matrice agit comme une simple multiplication.")

### üéØ Application : Puissance Matricielle avec Diagonalisation

Si $A = PDP^{-1}$, alors :
$$A^n = PD^nP^{-1}$$

C'est **beaucoup plus rapide** car $D^n$ est trivial (√©lever chaque valeur propre √† la puissance $n$) !

In [None]:
# ‚ö° Calcul rapide de A^100 par diagonalisation

import time

A = np.array([[3, 1],
              [1, 3]])

n = 100

# M√©thode 1 : Multiplication na√Øve
start = time.time()
result_naive = np.linalg.matrix_power(A, n)
time_naive = time.time() - start

# M√©thode 2 : Diagonalisation
start = time.time()
Œª, P = np.linalg.eig(A)
D = np.diag(Œª)
D_n = np.diag(Œª**n)  # Tr√®s rapide !
result_diag = P @ D_n @ np.linalg.inv(P)
time_diag = time.time() - start

print(f"Calcul de A^{n} :")
print(f"\n‚è±Ô∏è  M√©thode na√Øve : {time_naive*1000:.4f} ms")
print(f"‚ö° Diagonalisation : {time_diag*1000:.4f} ms")
print(f"\nüöÄ Acc√©l√©ration : {time_naive/time_diag:.2f}x")
print(f"\n‚úÖ R√©sultats identiques : {np.allclose(result_naive, result_diag)}")

print(f"\nR√©sultat :")
print(result_diag.real)  # .real pour enlever les parties imaginaires num√©riques

---

## 5Ô∏è‚É£ D√©composition SVD (Singular Value Decomposition) <a id="5-svd"></a>

### üìñ Th√©orie

La **SVD** est la d√©composition la plus importante en alg√®bre lin√©aire !

#### Th√©or√®me SVD

Toute matrice $A$ (m√™me non carr√©e !) peut s'√©crire :

$$A = U \Sigma V^T$$

O√π :
- $U$ : matrice orthogonale $m \times m$ (vecteurs singuliers gauches)
- $\Sigma$ : matrice diagonale $m \times n$ (valeurs singuli√®res)
- $V^T$ : matrice orthogonale $n \times n$ (vecteurs singuliers droits)

#### Valeurs Singuli√®res

Les **valeurs singuli√®res** $\sigma_1 \geq \sigma_2 \geq ... \geq \sigma_r > 0$ sont :
- Les racines carr√©es des valeurs propres de $A^T A$ (ou $AA^T$)
- Toujours **positives** et **ordonn√©es**
- Le nombre de valeurs non nulles = rang de $A$

#### Approximation de Rang Faible

On peut approximer $A$ en gardant seulement les $k$ plus grandes valeurs singuli√®res :

$$A_k = \sum_{i=1}^{k} \sigma_i \vec{u_i} \vec{v_i}^T$$

C'est la **meilleure approximation** de rang $k$ au sens de la norme de Frobenius !

### üî• CRUCIAL en ML

- **Compression d'images** : Stocker seulement les composantes principales
- **Recommandation** : Matrix factorization (Netflix, Amazon)
- **NLP** : Latent Semantic Analysis (LSA)
- **R√©duction de dimension** : Alternative √† PCA
- **Denoising** : Enlever le bruit en coupant les petites valeurs singuli√®res

In [None]:
# üîç D√©composition SVD d'une matrice

def svd_analysis(A, name="Matrice"):
    """Analyse compl√®te de la SVD."""
    print(f"\n{'='*60}")
    print(f"{name}")
    print(f"{'='*60}")
    print("Matrice A :")
    print(A)
    print(f"Shape : {A.shape}")
    
    # SVD
    U, s, Vt = np.linalg.svd(A, full_matrices=False)
    
    print(f"\nüìä Valeurs singuli√®res :")
    for i, œÉ in enumerate(s, 1):
        print(f"   œÉ{i} = {œÉ:.4f}")
    
    print(f"\nüìå Propri√©t√©s :")
    print(f"   Rang de A = {np.sum(s > 1e-10)}")
    print(f"   Nombre de valeurs singuli√®res > 0 : {np.sum(s > 1e-10)}")
    print(f"   Plus grande valeur singuli√®re : {s[0]:.4f}")
    print(f"   Plus petite valeur singuli√®re : {s[-1]:.4f}")
    print(f"   Condition number : {s[0]/s[-1]:.4f}")
    
    # Reconstruction
    Sigma = np.zeros((U.shape[1], Vt.shape[0]))
    Sigma[:len(s), :len(s)] = np.diag(s)
    A_reconstructed = U @ Sigma @ Vt
    
    print(f"\n‚úÖ V√©rification de la reconstruction :")
    reconstruction_error = np.linalg.norm(A - A_reconstructed)
    print(f"   Erreur de reconstruction : {reconstruction_error:.2e}")
    print(f"   Reconstruction parfaite : {np.allclose(A, A_reconstructed)}")
    
    return U, s, Vt

# Exemple 1 : Matrice simple
A1 = np.array([[3, 1, 1],
               [1, 3, 1]])
U1, s1, Vt1 = svd_analysis(A1, "Matrice 2√ó3")

# Exemple 2 : Matrice de rang faible
A2 = np.array([[1, 2],
               [2, 4],
               [3, 6]])  # Toutes les lignes sont proportionnelles
U2, s2, Vt2 = svd_analysis(A2, "Matrice 3√ó2 de rang 1")

In [None]:
# üé® Visualisation : Approximation de rang faible

# Cr√©er une matrice 10√ó10 avec structure
np.random.seed(42)
# Matrice de rang faible + bruit
u = np.random.randn(10, 1)
v = np.random.randn(1, 10)
A = u @ v + 0.1 * np.random.randn(10, 10)

# SVD
U, s, Vt = np.linalg.svd(A)

# Approximations avec diff√©rents rangs
fig, axes = plt.subplots(2, 3, figsize=(15, 10))

# Matrice originale
im = axes[0, 0].imshow(A, cmap='RdBu_r', vmin=-2, vmax=2)
axes[0, 0].set_title('Matrice Originale', fontweight='bold')
plt.colorbar(im, ax=axes[0, 0])

# Approximations
ranks = [1, 2, 3, 5, 10]
for idx, k in enumerate(ranks):
    ax_idx = (idx + 1) // 3, (idx + 1) % 3
    
    # Approximation de rang k
    Sigma_k = np.zeros_like(A)
    Sigma_k[:k, :k] = np.diag(s[:k])
    A_k = U @ Sigma_k @ Vt
    
    # Erreur
    error = np.linalg.norm(A - A_k, 'fro')
    
    im = axes[ax_idx].imshow(A_k, cmap='RdBu_r', vmin=-2, vmax=2)
    axes[ax_idx].set_title(f'Rang {k}\nErreur: {error:.3f}', fontweight='bold')
    plt.colorbar(im, ax=axes[ax_idx])

plt.tight_layout()
plt.show()

# Graphique des valeurs singuli√®res
plt.figure(figsize=(10, 5))
plt.plot(range(1, len(s) + 1), s, 'o-', linewidth=2, markersize=8)
plt.xlabel('Index', fontsize=12)
plt.ylabel('Valeur Singuli√®re', fontsize=12)
plt.title('Spectre des Valeurs Singuli√®res', fontsize=14, fontweight='bold')
plt.grid(True, alpha=0.3)
plt.yscale('log')
plt.axhline(y=0.1, color='r', linestyle='--', label='Seuil de bruit')
plt.legend()
plt.tight_layout()
plt.show()

print("\nüí° Observation :")
print("   Les premi√®res valeurs singuli√®res capturent la structure principale.")
print("   Les petites valeurs = bruit qu'on peut ignorer !")

---

## 6Ô∏è‚É£ PCA - Principal Component Analysis <a id="6-pca"></a>

### üìñ Th√©orie

**PCA** (Analyse en Composantes Principales) est une technique de **r√©duction de dimension**.

#### Objectif

Trouver les **directions de variance maximale** dans les donn√©es.

#### Algorithme PCA

1. **Centrer** les donn√©es : $X_{centered} = X - \bar{X}$
2. **Calculer** la matrice de covariance : $C = \frac{1}{n-1} X_{centered}^T X_{centered}$
3. **Trouver** les vecteurs propres et valeurs propres de $C$
4. **Trier** par valeurs propres d√©croissantes
5. **Projeter** sur les $k$ premiers vecteurs propres

#### Variance Expliqu√©e

La **variance expliqu√©e** par la $i$-√®me composante :

$$\text{Variance expliqu√©e}_i = \frac{\lambda_i}{\sum_j \lambda_j}$$

#### Lien avec SVD

PCA peut aussi se calculer via SVD de $X_{centered}$ :
- Les **composantes principales** = colonnes de $V$
- Les **valeurs propres** = $\sigma_i^2 / (n-1)$

### üî• CRUCIAL en ML

- **Visualisation** : R√©duire √† 2D ou 3D pour explorer les donn√©es
- **Feature reduction** : Acc√©l√©rer l'entra√Ænement en gardant l'essentiel
- **Denoising** : Enlever les dimensions de bruit
- **Compression** : Stocker moins de features
- **D√©tection d'anomalies** : Points loin des composantes principales = outliers

In [None]:
# üî¨ Impl√©mentation de PCA from scratch

class PCA_FromScratch:
    """PCA impl√©ment√© √† la main pour comprendre."""
    
    def __init__(self, n_components=2):
        self.n_components = n_components
        self.components = None
        self.mean = None
        self.eigenvalues = None
    
    def fit(self, X):
        """Ajuster PCA sur les donn√©es X."""
        # √âtape 1 : Centrer les donn√©es
        self.mean = np.mean(X, axis=0)
        X_centered = X - self.mean
        
        # √âtape 2 : Matrice de covariance
        cov_matrix = np.cov(X_centered.T)
        
        # √âtape 3 : Valeurs propres et vecteurs propres
        eigenvalues, eigenvectors = np.linalg.eig(cov_matrix)
        
        # √âtape 4 : Trier par valeurs propres d√©croissantes
        idx = np.argsort(eigenvalues)[::-1]
        eigenvalues = eigenvalues[idx]
        eigenvectors = eigenvectors[:, idx]
        
        # √âtape 5 : Garder les k premi√®res composantes
        self.components = eigenvectors[:, :self.n_components]
        self.eigenvalues = eigenvalues[:self.n_components]
        
        return self
    
    def transform(self, X):
        """Projeter les donn√©es sur les composantes principales."""
        X_centered = X - self.mean
        return X_centered @ self.components
    
    def fit_transform(self, X):
        """Ajuster et transformer en une seule √©tape."""
        self.fit(X)
        return self.transform(X)
    
    def explained_variance_ratio(self):
        """Proportion de variance expliqu√©e par chaque composante."""
        return self.eigenvalues / np.sum(self.eigenvalues)

# Test avec des donn√©es synth√©tiques
np.random.seed(42)
# Donn√©es corr√©l√©es en 3D
n_samples = 200
X = np.random.randn(n_samples, 3)
X[:, 1] = X[:, 0] + 0.5 * np.random.randn(n_samples)  # Corr√©lation
X[:, 2] = 0.1 * np.random.randn(n_samples)  # Peu de variance

# Appliquer PCA
pca = PCA_FromScratch(n_components=2)
X_pca = pca.fit_transform(X)

print("üìä R√©sultats PCA")
print(f"\nShape originale : {X.shape}")
print(f"Shape apr√®s PCA : {X_pca.shape}")
print(f"\nComposantes principales (vecteurs propres) :")
print(pca.components.T)
print(f"\nVariance expliqu√©e par chaque composante :")
for i, ratio in enumerate(pca.explained_variance_ratio(), 1):
    print(f"   PC{i} : {ratio*100:.2f}%")
print(f"\nVariance totale expliqu√©e : {np.sum(pca.explained_variance_ratio())*100:.2f}%")

In [None]:
# üé® Visualisation : PCA en action

fig = plt.figure(figsize=(16, 5))

# 1. Donn√©es 3D originales
ax1 = fig.add_subplot(131, projection='3d')
ax1.scatter(X[:, 0], X[:, 1], X[:, 2], c='blue', alpha=0.6, s=20)
ax1.set_xlabel('X‚ÇÅ')
ax1.set_ylabel('X‚ÇÇ')
ax1.set_zlabel('X‚ÇÉ')
ax1.set_title('Donn√©es Originales (3D)', fontweight='bold', fontsize=12)

# 2. Projection sur PC1-PC2
ax2 = fig.add_subplot(132)
scatter = ax2.scatter(X_pca[:, 0], X_pca[:, 1], c='red', alpha=0.6, s=20)
ax2.set_xlabel('PC1 (Composante Principale 1)')
ax2.set_ylabel('PC2 (Composante Principale 2)')
ax2.set_title('Apr√®s PCA (2D)\nGarde l\'essentiel de l\'information', 
              fontweight='bold', fontsize=12)
ax2.grid(True, alpha=0.3)
ax2.axhline(y=0, color='k', linewidth=0.5)
ax2.axvline(x=0, color='k', linewidth=0.5)

# 3. Variance expliqu√©e
ax3 = fig.add_subplot(133)
# Calculer pour toutes les composantes
pca_full = PCA_FromScratch(n_components=3)
pca_full.fit(X)
variance_ratios = pca_full.explained_variance_ratio()
cumulative_variance = np.cumsum(variance_ratios)

x_pos = np.arange(1, len(variance_ratios) + 1)
ax3.bar(x_pos, variance_ratios * 100, alpha=0.6, label='Variance individuelle')
ax3.plot(x_pos, cumulative_variance * 100, 'ro-', linewidth=2, 
         markersize=8, label='Variance cumul√©e')
ax3.set_xlabel('Composante Principale')
ax3.set_ylabel('Variance Expliqu√©e (%)')
ax3.set_title('Scree Plot\nCombien de composantes garder ?', 
              fontweight='bold', fontsize=12)
ax3.set_xticks(x_pos)
ax3.legend()
ax3.grid(True, alpha=0.3)
ax3.axhline(y=95, color='green', linestyle='--', label='Seuil 95%')

plt.tight_layout()
plt.show()

print("\nüí° Interpr√©tation :")
print("   - Les 2 premi√®res composantes capturent ~{:.1f}% de la variance".format(
    cumulative_variance[1]*100))
print("   - La 3√®me composante n'apporte que {:.1f}% d'information".format(
    variance_ratios[2]*100))
print("   ‚Üí On peut donc r√©duire de 3D √† 2D sans perte majeure !")

### üéØ Exemple R√©aliste : PCA sur Dataset Iris

In [None]:
# üå∏ PCA sur le dataset Iris (4D ‚Üí 2D)

from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler

# Charger les donn√©es
iris = load_iris()
X_iris = iris.data
y_iris = iris.target
feature_names = iris.feature_names
target_names = iris.target_names

print("üìä Dataset Iris")
print(f"Shape : {X_iris.shape} (150 √©chantillons, 4 features)")
print(f"Features : {feature_names}")
print(f"Classes : {target_names}")

# Standardiser (important pour PCA !)
scaler = StandardScaler()
X_iris_scaled = scaler.fit_transform(X_iris)

# PCA
pca_iris = PCA_FromScratch(n_components=2)
X_iris_pca = pca_iris.fit_transform(X_iris_scaled)

print(f"\n‚úÖ PCA effectu√©e : 4D ‚Üí 2D")
print(f"Variance expliqu√©e :")
for i, ratio in enumerate(pca_iris.explained_variance_ratio(), 1):
    print(f"   PC{i} : {ratio*100:.2f}%")
print(f"Total : {np.sum(pca_iris.explained_variance_ratio())*100:.2f}%")

# Visualisation
plt.figure(figsize=(10, 7))
colors = ['red', 'green', 'blue']
for i, target_name in enumerate(target_names):
    plt.scatter(X_iris_pca[y_iris == i, 0], 
                X_iris_pca[y_iris == i, 1],
                c=colors[i], label=target_name, alpha=0.7, s=50)

plt.xlabel(f'PC1 ({pca_iris.explained_variance_ratio()[0]*100:.1f}% variance)', 
           fontsize=12)
plt.ylabel(f'PC2 ({pca_iris.explained_variance_ratio()[1]*100:.1f}% variance)', 
           fontsize=12)
plt.title('Dataset Iris projet√© sur les 2 premi√®res composantes principales', 
          fontsize=14, fontweight='bold')
plt.legend(fontsize=11)
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

print("\nüí° Observation :")
print("   Les 3 esp√®ces d'iris sont bien s√©par√©es en 2D !")
print("   PCA a r√©duit la dimension tout en pr√©servant la structure des donn√©es.")

---

## 7Ô∏è‚É£ Applications en Finance Quantitative <a id="7-applications-finance"></a>

### üî• Pourquoi c'est crucial pour la Finance ?

L'alg√®bre lin√©aire avanc√©e est au c≈ìur de la finance quantitative moderne.

#### 1. Analyse de Portefeuille avec PCA

**Objectif** : Identifier les **facteurs de risque** principaux dans un portefeuille.

- Les composantes principales = facteurs de risque ind√©pendants
- Permet de comprendre les corr√©lations cach√©es entre actifs
- R√©duction de dimension pour grandes matrices de corr√©lation

#### 2. Optimisation de Portefeuille

Le probl√®me de **Markowitz** :
$$\min_{w} w^T \Sigma w \quad \text{sujet √†} \quad w^T \mu \geq r_{\text{target}}$$

N√©cessite :
- Inversion de matrice de covariance $\Sigma$
- Valeurs propres pour v√©rifier la d√©finition positive
- SVD pour matrices mal conditionn√©es

#### 3. Pricing d'Options

- R√©solution de syst√®mes lin√©aires pour grilles de diff√©rences finies
- D√©composition de Cholesky pour simulation Monte Carlo
- Vecteurs propres pour mod√®les multi-factoriels

#### 4. Gestion de Risque

- **VaR** (Value at Risk) : Utilise la matrice de covariance
- **Stress testing** : Analyse en composantes principales des sc√©narios
- **Hedging** : R√©solution de syst√®mes pour delta-hedging

In [None]:
# üí∞ Exemple : Analyse de Portefeuille avec PCA

# Simuler des rendements d'actifs corr√©l√©s
np.random.seed(42)
n_days = 252  # 1 an de trading
n_assets = 10

# Cr√©er des rendements avec structure de corr√©lation
# 3 facteurs cach√©s
factors = np.random.randn(n_days, 3)
loadings = np.random.randn(n_assets, 3)
noise = 0.3 * np.random.randn(n_days, n_assets)
returns = (factors @ loadings.T + noise) * 0.01  # Rendements en %

# Ajouter des noms d'actifs
asset_names = [f'Action_{i+1}' for i in range(n_assets)]

print("üìà Simulation de Portefeuille")
print(f"Nombre d'actifs : {n_assets}")
print(f"Nombre de jours : {n_days}")
print(f"\nRendements moyens (% par jour) :")
for i, name in enumerate(asset_names):
    print(f"   {name} : {np.mean(returns[:, i])*100:.3f}%")

# Matrice de corr√©lation
correlation_matrix = np.corrcoef(returns.T)

# PCA sur les rendements
pca_portfolio = PCA_FromScratch(n_components=5)
pca_portfolio.fit(returns)

print(f"\nüîç Analyse PCA du Portefeuille")
print(f"\nVariance expliqu√©e par chaque facteur :")
variance_ratios = pca_portfolio.explained_variance_ratio()
cumulative = 0
for i, ratio in enumerate(variance_ratios, 1):
    cumulative += ratio
    print(f"   Facteur {i} : {ratio*100:.2f}% (cumul√©: {cumulative*100:.2f}%)")

# Visualisation
fig, axes = plt.subplots(1, 2, figsize=(15, 6))

# Matrice de corr√©lation
im = axes[0].imshow(correlation_matrix, cmap='RdBu_r', vmin=-1, vmax=1)
axes[0].set_xticks(range(n_assets))
axes[0].set_yticks(range(n_assets))
axes[0].set_xticklabels(asset_names, rotation=45, ha='right')
axes[0].set_yticklabels(asset_names)
axes[0].set_title('Matrice de Corr√©lation des Actifs', fontweight='bold')
plt.colorbar(im, ax=axes[0])

# Variance expliqu√©e
x_pos = np.arange(1, len(variance_ratios) + 1)
axes[1].bar(x_pos, variance_ratios * 100, alpha=0.7, color='steelblue')
axes[1].plot(x_pos, np.cumsum(variance_ratios) * 100, 'ro-', 
             linewidth=2, markersize=8, label='Cumul√©e')
axes[1].set_xlabel('Facteur de Risque')
axes[1].set_ylabel('Variance Expliqu√©e (%)')
axes[1].set_title('Facteurs de Risque Principaux\n(Scree Plot)', fontweight='bold')
axes[1].set_xticks(x_pos)
axes[1].legend()
axes[1].grid(True, alpha=0.3)
axes[1].axhline(y=80, color='green', linestyle='--', alpha=0.5, 
                label='Seuil 80%')

plt.tight_layout()
plt.show()

print("\nüí° Insights Financiers :")
n_factors_80 = np.argmax(np.cumsum(variance_ratios) >= 0.8) + 1
print(f"   - {n_factors_80} facteurs expliquent 80% du risque du portefeuille")
print(f"   - Au lieu de g√©rer {n_assets} actifs, on peut se concentrer sur {n_factors_80} facteurs")
print(f"   - Simplifie √©norm√©ment la gestion de risque !")

---

## üìù R√©sum√© du Chapitre

### üéØ Concepts Cl√©s Ma√Ætris√©s

1. **Espaces Vectoriels** :
   - Sous-espaces et dimensions
   - Span et combinaisons lin√©aires

2. **Ind√©pendance Lin√©aire** :
   - Test avec le rang
   - Bases et dimensions

3. **Rang** :
   - Interpr√©tation g√©om√©trique
   - Rang plein vs d√©ficient
   - Impact sur les transformations

4. **Valeurs/Vecteurs Propres** :
   - Directions invariantes
   - Diagonalisation
   - Applications en stabilit√© et puissance

5. **SVD** :
   - D√©composition universelle
   - Approximation de rang faible
   - Compression et denoising

6. **PCA** :
   - R√©duction de dimension
   - Variance expliqu√©e
   - Visualisation et compression

### üöÄ Applications en ML et Finance

- ‚úÖ **Deep Learning** : Comprendre les transformations dans les r√©seaux
- ‚úÖ **Dimensionality Reduction** : PCA pour features engineering
- ‚úÖ **Recommandation** : SVD pour matrix factorization
- ‚úÖ **Portfolio Optimization** : Analyse de risque avec PCA
- ‚úÖ **Compression** : Images, audio, donn√©es financi√®res

### üìö Pour Aller Plus Loin

**Exercices** : `exercices_04_algebre_avancee.ipynb` (30+ exercices)

**Solutions** : `solutions_04_algebre_avancee.ipynb`

**Projet** : `projet_04_compression_svd.ipynb` - Compression d'images avec SVD

---

## üéâ F√©licitations !

Tu ma√Ætrises maintenant l'alg√®bre lin√©aire avanc√©e, un outil **indispensable** pour :
- üß† Comprendre le Deep Learning en profondeur
- üí∞ Faire de la finance quantitative de haut niveau
- üìä Analyser et r√©duire la dimension des donn√©es
- üöÄ Optimiser les algorithmes de ML

**Continue avec le Chapitre 05 : Calcul Diff√©rentiel** pour compl√©ter ta bo√Æte √† outils math√©matique ! üí™üî•