# üì¶ Installation et Configuration de l'Environnement Python pour ML/LLM

Bienvenue dans ce premier cours ! Avant de coder, il est essentiel de bien configurer votre environnement de travail. Ce notebook vous guidera pas √† pas.

## üéØ Objectifs
- Comprendre pourquoi utiliser **Miniconda** pour le Machine Learning
- Ma√Ætriser les environnements virtuels
- Installer les packages essentiels pour le ML/LLM
- V√©rifier que tout fonctionne correctement

---
## 1Ô∏è‚É£ Installation de Python avec Miniconda

### Pourquoi Miniconda plut√¥t qu'Anaconda ?

| Miniconda | Anaconda |
|-----------|----------|
| ~80 MB (l√©ger) | ~3 GB (lourd) |
| Installe seulement le n√©cessaire | 8000+ packages pr√©-install√©s |
| Plus rapide √† installer | Beaucoup de packages inutiles |
| **‚úÖ Recommand√©** | Trop volumineux |

**Miniconda** inclut :
- **Python**
- **Conda** : gestionnaire de packages et d'environnements
- C'est tout ! Tu installes ce dont tu as besoin, rien de plus.

---

### üì• Installation sur Mac Apple Silicon (M1/M2/M3/M4)

1. Va sur : [https://www.anaconda.com/download](https://www.anaconda.com/download)
2. Dans la section **Miniconda** (√† droite), clique sur :

   **‚Üí 64-Bit (Apple silicon) Graphical Installer**

3. Ouvre le fichier `.pkg` t√©l√©charg√©
4. Suis l'installation (clique "Continuer" plusieurs fois)
5. **Ferme et rouvre ton Terminal** (important !)

---

### üì• Installation sur Windows

1. Va sur : [https://www.anaconda.com/download](https://www.anaconda.com/download)
2. Dans la section **Miniconda**, t√©l√©charge **64-Bit (Windows)**
3. Lance l'installateur `.exe`
4. **Important** : Coche "Add Miniconda to PATH" pendant l'installation
5. Utilise "Anaconda Prompt" pour les commandes conda

---

### ‚úÖ V√©rification de l'installation

Ouvre un **nouveau** Terminal (important : nouveau !) et tape :

```bash
conda --version
```

Tu devrais voir quelque chose comme `conda 24.x.x`

In [2]:
# Dans un terminal, ex√©cutez ces commandes (PAS dans Jupyter pour l'instant)
# conda --version
# python --version

# Dans Jupyter, vous pouvez v√©rifier la version de Python comme ceci :
import sys
print(f"Version de Python : {sys.version}")
print(f"Chemin de l'ex√©cutable Python : {sys.executable}")

Version de Python : 3.10.16 (main, Nov 15 2025, 19:04:17) [Clang 17.0.0 (clang-1700.3.19.1)]
Chemin de l'ex√©cutable Python : /Users/sanz/.pyenv/versions/3.10.16/bin/python


**R√©sultat attendu :** Vous devriez voir quelque chose comme `Python 3.11.x` ou `Python 3.10.x`

---
## 2Ô∏è‚É£ Qu'est-ce qu'un Environnement Virtuel ?

### ü§î Le probl√®me

Imaginez que vous travaillez sur deux projets :
- **Projet A** : n√©cessite TensorFlow 2.10
- **Projet B** : n√©cessite TensorFlow 2.15

Si vous installez les deux versions au m√™me endroit, **conflit garanti** ! üí•

### üí° La solution : Environnements virtuels

Un environnement virtuel est comme une **bo√Æte isol√©e** qui contient :
- Une version sp√©cifique de Python
- Un ensemble de packages sp√©cifiques
- Totalement ind√©pendant des autres environnements

```
Votre ordinateur
‚îú‚îÄ‚îÄ Environnement de base (base)
‚îú‚îÄ‚îÄ Environnement "llm" (Python 3.11, PyTorch 2.0, transformers)
‚îú‚îÄ‚îÄ Environnement "data-science" (Python 3.10, TensorFlow 2.10)
‚îî‚îÄ‚îÄ Environnement "web" (Python 3.9, Django)
```

### ‚úÖ Avantages
- Pas de conflits entre projets
- Reproductibilit√© : facile de recr√©er l'environnement
- Propret√© : supprimez un projet, supprimez son environnement
- Flexibilit√© : testez diff√©rentes versions sans risque

---
## 3Ô∏è‚É£ Cr√©er un Environnement avec Conda

### üìù Commande de base

Ouvrez un terminal et ex√©cutez :

```bash
conda create -n llm python=3.11
```

**D√©cryptage de la commande :**
- `conda create` : cr√©e un nouvel environnement
- `-n llm` : nomme l'environnement "llm" (vous pouvez choisir n'importe quel nom)
- `python=3.11` : installe Python version 3.11

### üîÑ Options utiles

```bash
# Cr√©er avec des packages directement
conda create -n llm python=3.11 numpy pandas jupyter

# Cr√©er avec une version sp√©cifique de package
conda create -n llm python=3.11 numpy=1.24

# Cr√©er depuis un fichier de configuration
conda create -n llm --file requirements.txt
```

### üìã Commandes utiles pour g√©rer les environnements

```bash
# Lister tous les environnements
conda env list

# Supprimer un environnement
conda remove -n llm --all

# Cloner un environnement
conda create -n llm-backup --clone llm

# Exporter un environnement (pour le partager)
conda env export > environment.yml

# Cr√©er depuis un export
conda env create -f environment.yml
```

---
## 4Ô∏è‚É£ Activer et D√©sactiver un Environnement

### üü¢ Activer un environnement

**Windows :**
```bash
conda activate llm
```

**Mac/Linux :**
```bash
conda activate llm
```

Votre terminal devrait maintenant afficher `(llm)` au d√©but de la ligne, indiquant que l'environnement est actif.

### üî¥ D√©sactiver un environnement

```bash
conda deactivate
```

Vous reviendrez √† l'environnement de base `(base)`.

### ‚ö†Ô∏è Important

- **Toujours activer l'environnement** avant d'installer des packages ou de lancer Jupyter
- Si Jupyter ne voit pas vos packages, v√©rifiez que vous √™tes dans le bon environnement
- L'activation est **temporaire** : quittez le terminal, il faut r√©activer

In [3]:
# V√©rifier dans quel environnement vous √™tes actuellement
import os
import sys

print(f"Environnement actif : {os.environ.get('CONDA_DEFAULT_ENV', 'Non d√©tect√©')}")
print(f"Chemin Python : {sys.executable}")

Environnement actif : Non d√©tect√©
Chemin Python : /Users/sanz/.pyenv/versions/3.10.16/bin/python


---
## 5Ô∏è‚É£ Installer des Packages : pip vs conda

### üîÑ Deux gestionnaires de packages

| Caract√©ristique | conda | pip |
|----------------|-------|-----|
| Source | Anaconda repository | Python Package Index (PyPI) |
| Langages | Python + R + C++ | Python uniquement |
| D√©pendances | G√®re tout (y compris non-Python) | Python uniquement |
| Vitesse | Plus lent | Plus rapide |
| Disponibilit√© | Moins de packages | Plus de packages |

### üì¶ Installation avec conda

```bash
# Installation basique
conda install numpy

# Version sp√©cifique
conda install numpy=1.24.0

# Plusieurs packages √† la fois
conda install numpy pandas matplotlib

# Depuis un canal sp√©cifique
conda install -c conda-forge transformers
```

### üì¶ Installation avec pip

```bash
# Installation basique
pip install torch

# Version sp√©cifique
pip install torch==2.0.0

# Plusieurs packages
pip install torch transformers datasets

# Depuis un fichier requirements.txt
pip install -r requirements.txt

# Mettre √† jour un package
pip install --upgrade torch
```

### üéØ R√®gle d'or

1. **Privil√©giez conda** pour les packages scientifiques (numpy, scipy, pandas)
2. **Utilisez pip** si le package n'existe pas dans conda
3. **√âvitez de m√©langer** conda et pip autant que possible
4. Si vous devez m√©langer : **conda d'abord, pip ensuite**

### üìã Commandes utiles

```bash
# Lister les packages install√©s
conda list
pip list

# Rechercher un package
conda search numpy
pip search numpy  # (d√©sactiv√© depuis 2021, utilisez pypi.org)

# D√©sinstaller un package
conda remove numpy
pip uninstall numpy

# Mettre √† jour tous les packages
conda update --all
pip list --outdated  # liste les packages √† mettre √† jour
```

---
## 6Ô∏è‚É£ Packages Essentiels pour ML/LLM

Voici les packages √† installer dans votre environnement `llm`. **Activez d'abord votre environnement !**

```bash
conda activate llm
```

### üìä Data Science de base

```bash
conda install numpy pandas matplotlib seaborn
```

- **numpy** : calculs num√©riques, matrices, alg√®bre lin√©aire
- **pandas** : manipulation de donn√©es tabulaires (DataFrame)
- **matplotlib** : visualisation de donn√©es (graphiques)
- **seaborn** : visualisation statistique avanc√©e

### ü§ñ Machine Learning classique

```bash
conda install scikit-learn
```

- **scikit-learn** : algorithmes ML (classification, r√©gression, clustering)

### üß† Deep Learning avec PyTorch

**Pour Mac Apple Silicon (M1/M2/M3/M4) :**
```bash
# Utilise automatiquement le GPU Metal (MPS)
pip install torch torchvision torchaudio
```

**Pour Windows/Linux CPU :**
```bash
conda install pytorch torchvision torchaudio cpuonly -c pytorch
```

**Pour Windows/Linux avec GPU NVIDIA :**
```bash
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
```

- **pytorch** : framework de deep learning
- **torchvision** : utilitaires pour la vision par ordinateur
- **torchaudio** : utilitaires pour l'audio

> üí° **Note Mac M4** : PyTorch supporte le GPU Apple Silicon via MPS (Metal Performance Shaders). C'est automatique !

### ü§ó Hugging Face pour les LLM

```bash
pip install transformers datasets accelerate
```

- **transformers** : mod√®les pr√©-entra√Æn√©s (GPT, BERT, LLaMA, etc.)
- **datasets** : acc√®s √† des milliers de datasets
- **accelerate** : entra√Ænement distribu√© simplifi√©

### üìì Jupyter et outils de d√©veloppement

```bash
conda install jupyter ipykernel notebook
```

### üéÅ Packages bonus utiles

```bash
pip install tqdm pillow python-dotenv
```

---

### üì¶ Installation compl√®te en une commande

**Pour Mac Apple Silicon (M1/M2/M3/M4) :**
```bash
# 1. Cr√©er l'environnement
conda create -n llm python=3.11 numpy pandas matplotlib seaborn scikit-learn jupyter ipykernel notebook requests -y

# 2. Activer
conda activate llm

# 3. Installer PyTorch (avec support GPU Metal/MPS)
pip install torch torchvision torchaudio

# 4. Installer Hugging Face et bonus
pip install transformers datasets accelerate tqdm pillow python-dotenv

# 5. Enregistrer dans Jupyter
python -m ipykernel install --user --name=llm --display-name="Python (LLM)"
```

**Pour Windows/Linux :**
```bash
# 1. Cr√©er l'environnement
conda create -n llm python=3.11 numpy pandas matplotlib seaborn scikit-learn jupyter ipykernel notebook requests -y

# 2. Activer
conda activate llm

# 3. Installer PyTorch (CPU)
conda install pytorch torchvision torchaudio cpuonly -c pytorch -y

# 4. Installer Hugging Face et bonus
pip install transformers datasets accelerate tqdm pillow python-dotenv

# 5. Enregistrer dans Jupyter
python -m ipykernel install --user --name=llm --display-name="Python (LLM)"
```

---
## 7Ô∏è‚É£ V√©rification des Installations

Ex√©cutez les cellules suivantes pour v√©rifier que tout est bien install√©.

In [4]:
# V√©rification de l'environnement Python
import sys
print(f"Version de Python : {sys.version}")
print(f"Ex√©cutable : {sys.executable}")

Version de Python : 3.10.16 (main, Nov 15 2025, 19:04:17) [Clang 17.0.0 (clang-1700.3.19.1)]
Ex√©cutable : /Users/sanz/.pyenv/versions/3.10.16/bin/python


In [5]:
# V√©rification des packages Data Science
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

print(f"‚úÖ NumPy version : {np.__version__}")
print(f"‚úÖ Pandas version : {pd.__version__}")
print(f"‚úÖ Matplotlib version : {plt.matplotlib.__version__}")

ModuleNotFoundError: No module named 'numpy'

In [None]:
# V√©rification de scikit-learn
import sklearn
print(f"‚úÖ Scikit-learn version : {sklearn.__version__}")

In [None]:
# V√©rification de PyTorch
import torch
print(f"‚úÖ PyTorch version : {torch.__version__}")

# V√©rification GPU
print(f"\nüéÆ Acc√©l√©ration GPU :")
print(f"  CUDA (NVIDIA) : {torch.cuda.is_available()}")
print(f"  MPS (Apple Silicon) : {torch.backends.mps.is_available()}")

if torch.cuda.is_available():
    print(f"  ‚Üí Device CUDA : {torch.cuda.get_device_name(0)}")
elif torch.backends.mps.is_available():
    print(f"  ‚Üí Apple Silicon GPU disponible ! üçé")
    print(f"    Ton Mac M4 peut acc√©l√©rer les calculs PyTorch !")
else:
    print("  ‚Üí Mode CPU uniquement")

In [None]:
# V√©rification de Transformers (Hugging Face)
import transformers
print(f"‚úÖ Transformers version : {transformers.__version__}")

In [None]:
# Test rapide : cr√©er un petit graphique
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(0, 10, 100)
y = np.sin(x)

plt.figure(figsize=(8, 4))
plt.plot(x, y, label='sin(x)', color='blue', linewidth=2)
plt.xlabel('x')
plt.ylabel('y')
plt.title('Test de Matplotlib : fonction sinus')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

print("‚úÖ Si vous voyez un graphique ci-dessus, Matplotlib fonctionne !")

In [None]:
# Test rapide : cr√©er un DataFrame pandas
import pandas as pd

data = {
    'Nom': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'Ville': ['Paris', 'Lyon', 'Marseille']
}

df = pd.DataFrame(data)
print("‚úÖ Test de Pandas - DataFrame cr√©√© :")
print(df)

In [None]:
# Test rapide : op√©ration avec PyTorch
import torch

# Cr√©er un tenseur
tensor = torch.tensor([[1, 2], [3, 4]], dtype=torch.float32)
print("Tenseur original :")
print(tensor)

# Op√©ration simple
result = tensor * 2 + 1
print("\nApr√®s multiplication par 2 et addition de 1 :")
print(result)

print("\n‚úÖ PyTorch fonctionne correctement !")

### üéâ R√©sum√© des v√©rifications

Si toutes les cellules ci-dessus s'ex√©cutent sans erreur, **f√©licitations !** Votre environnement est pr√™t pour le Machine Learning et les LLM.

**Checklist :**
- ‚úÖ Python install√© et version correcte
- ‚úÖ NumPy, Pandas, Matplotlib fonctionnent
- ‚úÖ Scikit-learn install√©
- ‚úÖ PyTorch install√© (CPU ou GPU)
- ‚úÖ Transformers (Hugging Face) install√©
- ‚úÖ Jupyter fonctionne (vous lisez ce notebook !)

---
## 8Ô∏è‚É£ R√©solution de Probl√®mes Courants

### ‚ùå Probl√®me 1 : "conda n'est pas reconnu"

**Sympt√¥me :** En tapant `conda` dans le terminal, tu obtiens une erreur.

**Solutions Mac :**
1. Ferme et rouvre le Terminal (important !)
2. Si √ßa ne marche toujours pas, tape :
```bash
source ~/miniconda3/bin/activate
conda init zsh
```
3. Ferme et rouvre le Terminal

**Solutions Windows :**
1. Utilise "Anaconda Prompt" au lieu du terminal standard
2. Ou r√©installe Miniconda en cochant "Add to PATH"

---

### ‚ùå Probl√®me 2 : "ModuleNotFoundError: No module named 'xxx'"

**Sympt√¥me :** Python ne trouve pas un package que tu as install√©.

**Causes possibles :**
1. Package install√© dans un autre environnement
2. Jupyter utilise un autre kernel

**Solutions :**
```bash
# V√©rifier l'environnement actif
conda env list  # L'environnement actif a une √©toile *

# Activer le bon environnement
conda activate llm

# Installer le package
conda install nom-du-package

# R√©enregistrer le kernel Jupyter
python -m ipykernel install --user --name=llm
```

---

### ‚ùå Probl√®me 3 : Installation PyTorch √©choue

**Pour Mac Apple Silicon :**
```bash
# M√©thode recommand√©e
pip install torch torchvision torchaudio

# Si √ßa ne marche pas, essaye :
pip install --upgrade pip
pip install torch torchvision torchaudio
```

**Pour Windows/Linux :**
```bash
# Utiliser pip au lieu de conda
pip install torch torchvision torchaudio
```

---

### ‚ùå Probl√®me 4 : Jupyter ne trouve pas l'environnement

**Solutions :**
```bash
# Activer l'environnement
conda activate llm

# R√©installer ipykernel
pip install ipykernel

# Enregistrer le kernel
python -m ipykernel install --user --name=llm --display-name="Python (LLM)"

# Lister les kernels disponibles
jupyter kernelspec list
```

---

### ‚ùå Probl√®me 5 : MPS (Apple Silicon GPU) non d√©tect√©

**Sympt√¥me :** `torch.backends.mps.is_available()` retourne `False`

**Solutions :**
```bash
# V√©rifier la version de macOS (12.3+ requis pour MPS)
sw_vers

# R√©installer PyTorch
pip uninstall torch torchvision torchaudio
pip install torch torchvision torchaudio
```

---

### üÜò Commandes de diagnostic

Ex√©cutez ces commandes pour diagnostiquer les probl√®mes :

In [None]:
# Diagnostic complet de l'environnement
import sys
import os

print("=" * 50)
print("DIAGNOSTIC DE L'ENVIRONNEMENT")
print("=" * 50)

print(f"\nüìç Version Python : {sys.version}")
print(f"üìç Ex√©cutable Python : {sys.executable}")
print(f"üìç Environnement actif : {os.environ.get('CONDA_DEFAULT_ENV', 'Non d√©tect√©')}")

print("\nüì¶ Packages install√©s :")
packages = ['numpy', 'pandas', 'matplotlib', 'sklearn', 'torch', 'transformers']

for pkg in packages:
    try:
        module = __import__(pkg)
        version = getattr(module, '__version__', 'Version inconnue')
        print(f"  ‚úÖ {pkg:15} : {version}")
    except ImportError:
        print(f"  ‚ùå {pkg:15} : NON INSTALL√â")

print("\nüéÆ GPU Info :")
try:
    import torch
    print(f"  CUDA (NVIDIA) : {torch.cuda.is_available()}")
    print(f"  MPS (Apple Silicon) : {torch.backends.mps.is_available()}")
    if torch.cuda.is_available():
        print(f"  ‚Üí Device CUDA : {torch.cuda.get_device_name(0)}")
    elif torch.backends.mps.is_available():
        print(f"  ‚Üí Apple Silicon GPU disponible ! üçé")
except Exception as e:
    print(f"  PyTorch non install√© ou probl√®me : {e}")

print("\n" + "=" * 50)

---
## üìö Ressources Suppl√©mentaires

### Documentation Officielle
- [Miniconda Documentation](https://docs.anaconda.com/miniconda/)
- [Conda Cheat Sheet](https://docs.conda.io/projects/conda/en/latest/user-guide/cheatsheet.html)
- [PyTorch Installation](https://pytorch.org/get-started/locally/)
- [PyTorch sur Apple Silicon](https://developer.apple.com/metal/pytorch/)
- [Hugging Face Transformers](https://huggingface.co/docs/transformers/installation)

### Tutoriels
- [Real Python - Virtual Environments](https://realpython.com/python-virtual-environments-a-primer/)
- [Jupyter Notebook Tutorial](https://jupyter-notebook.readthedocs.io/)

### Communaut√©s
- [Stack Overflow](https://stackoverflow.com/questions/tagged/python)
- [Reddit r/learnpython](https://www.reddit.com/r/learnpython/)
- [Hugging Face Forum](https://discuss.huggingface.co/)

---
## ‚úÖ Checklist Finale

Avant de passer au cours suivant, assure-toi que :

- [ ] Miniconda est install√© et fonctionne (`conda --version`)
- [ ] Tu comprends le concept d'environnement virtuel
- [ ] Tu as cr√©√© l'environnement `llm`
- [ ] Tu sais activer/d√©sactiver un environnement
- [ ] Tu comprends la diff√©rence entre conda et pip
- [ ] Tous les packages essentiels sont install√©s et test√©s
- [ ] Jupyter Notebook fonctionne avec le bon kernel
- [ ] Tu sais o√π trouver de l'aide en cas de probl√®me

---

## üéØ Prochaine √âtape

Maintenant que ton environnement est pr√™t, tu peux passer aux **cours de Math√©matiques** dans `Phase_1_Mathematiques/` !

On va apprendre :
- Les bases des maths (puissances, racines, variables)
- Les fonctions et leur repr√©sentation graphique
- La notation Sigma (Œ£) - essentielle pour le ML !

**Bon apprentissage ! üöÄ**