# üì¶ Installation et Configuration de l'Environnement Python pour ML/LLM

Bienvenue dans ce premier cours ! Avant de coder, il est essentiel de bien configurer votre environnement de travail. Ce notebook vous guidera pas √† pas.

## üéØ Objectifs
- Comprendre pourquoi utiliser Anaconda pour le Machine Learning
- Ma√Ætriser les environnements virtuels
- Installer les packages essentiels pour le ML/LLM
- V√©rifier que tout fonctionne correctement

---
## 1Ô∏è‚É£ Installation de Python avec Anaconda

### Pourquoi Anaconda ?

**Anaconda** est une distribution Python sp√©cialement con√ßue pour la science des donn√©es et le machine learning. Elle inclut :

- **Python** + plus de 250 packages pr√©-install√©s
- **Conda** : gestionnaire de packages et d'environnements
- **Jupyter Notebook** : pour coder de mani√®re interactive
- Gestion automatique des d√©pendances complexes

### üì• Installation

1. T√©l√©chargez Anaconda : [https://www.anaconda.com/download](https://www.anaconda.com/download)
2. Choisissez la version pour votre syst√®me (Windows/Mac/Linux)
3. Installez en suivant les instructions
4. **Important** : Cochez "Add Anaconda to PATH" pendant l'installation (Windows)

### ‚úÖ V√©rification de l'installation

Ouvrez un terminal (ou Anaconda Prompt sur Windows) et tapez :

In [None]:
# Dans un terminal, ex√©cutez ces commandes (PAS dans Jupyter pour l'instant)
# conda --version
# python --version

# Dans Jupyter, vous pouvez v√©rifier la version de Python comme ceci :
import sys
print(f"Version de Python : {sys.version}")
print(f"Chemin de l'ex√©cutable Python : {sys.executable}")

**R√©sultat attendu :** Vous devriez voir quelque chose comme `Python 3.11.x` ou `Python 3.10.x`

---
## 2Ô∏è‚É£ Qu'est-ce qu'un Environnement Virtuel ?

### ü§î Le probl√®me

Imaginez que vous travaillez sur deux projets :
- **Projet A** : n√©cessite TensorFlow 2.10
- **Projet B** : n√©cessite TensorFlow 2.15

Si vous installez les deux versions au m√™me endroit, **conflit garanti** ! üí•

### üí° La solution : Environnements virtuels

Un environnement virtuel est comme une **bo√Æte isol√©e** qui contient :
- Une version sp√©cifique de Python
- Un ensemble de packages sp√©cifiques
- Totalement ind√©pendant des autres environnements

```
Votre ordinateur
‚îú‚îÄ‚îÄ Environnement de base (base)
‚îú‚îÄ‚îÄ Environnement "llm" (Python 3.11, PyTorch 2.0, transformers)
‚îú‚îÄ‚îÄ Environnement "data-science" (Python 3.10, TensorFlow 2.10)
‚îî‚îÄ‚îÄ Environnement "web" (Python 3.9, Django)
```

### ‚úÖ Avantages
- Pas de conflits entre projets
- Reproductibilit√© : facile de recr√©er l'environnement
- Propret√© : supprimez un projet, supprimez son environnement
- Flexibilit√© : testez diff√©rentes versions sans risque

---
## 3Ô∏è‚É£ Cr√©er un Environnement avec Conda

### üìù Commande de base

Ouvrez un terminal et ex√©cutez :

```bash
conda create -n llm python=3.11
```

**D√©cryptage de la commande :**
- `conda create` : cr√©e un nouvel environnement
- `-n llm` : nomme l'environnement "llm" (vous pouvez choisir n'importe quel nom)
- `python=3.11` : installe Python version 3.11

### üîÑ Options utiles

```bash
# Cr√©er avec des packages directement
conda create -n llm python=3.11 numpy pandas jupyter

# Cr√©er avec une version sp√©cifique de package
conda create -n llm python=3.11 numpy=1.24

# Cr√©er depuis un fichier de configuration
conda create -n llm --file requirements.txt
```

### üìã Commandes utiles pour g√©rer les environnements

```bash
# Lister tous les environnements
conda env list

# Supprimer un environnement
conda remove -n llm --all

# Cloner un environnement
conda create -n llm-backup --clone llm

# Exporter un environnement (pour le partager)
conda env export > environment.yml

# Cr√©er depuis un export
conda env create -f environment.yml
```

---
## 4Ô∏è‚É£ Activer et D√©sactiver un Environnement

### üü¢ Activer un environnement

**Windows :**
```bash
conda activate llm
```

**Mac/Linux :**
```bash
conda activate llm
```

Votre terminal devrait maintenant afficher `(llm)` au d√©but de la ligne, indiquant que l'environnement est actif.

### üî¥ D√©sactiver un environnement

```bash
conda deactivate
```

Vous reviendrez √† l'environnement de base `(base)`.

### ‚ö†Ô∏è Important

- **Toujours activer l'environnement** avant d'installer des packages ou de lancer Jupyter
- Si Jupyter ne voit pas vos packages, v√©rifiez que vous √™tes dans le bon environnement
- L'activation est **temporaire** : quittez le terminal, il faut r√©activer

In [None]:
# V√©rifier dans quel environnement vous √™tes actuellement
import os
import sys

print(f"Environnement actif : {os.environ.get('CONDA_DEFAULT_ENV', 'Non d√©tect√©')}")
print(f"Chemin Python : {sys.executable}")

---
## 5Ô∏è‚É£ Installer des Packages : pip vs conda

### üîÑ Deux gestionnaires de packages

| Caract√©ristique | conda | pip |
|----------------|-------|-----|
| Source | Anaconda repository | Python Package Index (PyPI) |
| Langages | Python + R + C++ | Python uniquement |
| D√©pendances | G√®re tout (y compris non-Python) | Python uniquement |
| Vitesse | Plus lent | Plus rapide |
| Disponibilit√© | Moins de packages | Plus de packages |

### üì¶ Installation avec conda

```bash
# Installation basique
conda install numpy

# Version sp√©cifique
conda install numpy=1.24.0

# Plusieurs packages √† la fois
conda install numpy pandas matplotlib

# Depuis un canal sp√©cifique
conda install -c conda-forge transformers
```

### üì¶ Installation avec pip

```bash
# Installation basique
pip install torch

# Version sp√©cifique
pip install torch==2.0.0

# Plusieurs packages
pip install torch transformers datasets

# Depuis un fichier requirements.txt
pip install -r requirements.txt

# Mettre √† jour un package
pip install --upgrade torch
```

### üéØ R√®gle d'or

1. **Privil√©giez conda** pour les packages scientifiques (numpy, scipy, pandas)
2. **Utilisez pip** si le package n'existe pas dans conda
3. **√âvitez de m√©langer** conda et pip autant que possible
4. Si vous devez m√©langer : **conda d'abord, pip ensuite**

### üìã Commandes utiles

```bash
# Lister les packages install√©s
conda list
pip list

# Rechercher un package
conda search numpy
pip search numpy  # (d√©sactiv√© depuis 2021, utilisez pypi.org)

# D√©sinstaller un package
conda remove numpy
pip uninstall numpy

# Mettre √† jour tous les packages
conda update --all
pip list --outdated  # liste les packages √† mettre √† jour
```

---
## 6Ô∏è‚É£ Packages Essentiels pour ML/LLM

Voici les packages √† installer dans votre environnement `llm`. **Activez d'abord votre environnement !**

```bash
conda activate llm
```

### üìä Data Science de base

```bash
# Avec conda (recommand√©)
conda install numpy pandas matplotlib seaborn
```

- **numpy** : calculs num√©riques, matrices, alg√®bre lin√©aire
- **pandas** : manipulation de donn√©es tabulaires (DataFrame)
- **matplotlib** : visualisation de donn√©es (graphiques)
- **seaborn** : visualisation statistique avanc√©e

### ü§ñ Machine Learning classique

```bash
conda install scikit-learn
```

- **scikit-learn** : algorithmes ML (classification, r√©gression, clustering)

### üß† Deep Learning avec PyTorch

```bash
# Pour CPU uniquement
conda install pytorch torchvision torchaudio cpuonly -c pytorch

# Pour GPU (NVIDIA CUDA)
# V√©rifiez d'abord votre version CUDA : nvidia-smi
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
```

- **pytorch** : framework de deep learning
- **torchvision** : utilitaires pour la vision par ordinateur
- **torchaudio** : utilitaires pour l'audio

### ü§ó Hugging Face pour les LLM

```bash
pip install transformers datasets accelerate
```

- **transformers** : mod√®les pr√©-entra√Æn√©s (GPT, BERT, LLaMA, etc.)
- **datasets** : acc√®s √† des milliers de datasets
- **accelerate** : entra√Ænement distribu√© simplifi√©

### üìì Jupyter et outils de d√©veloppement

```bash
conda install jupyter ipykernel notebook
```

- **jupyter** : environnement Jupyter
- **ipykernel** : noyau Python pour Jupyter
- **notebook** : interface notebook classique

### üéÅ Packages bonus utiles

```bash
pip install tqdm  # barres de progression
pip install pillow  # manipulation d'images
conda install requests  # requ√™tes HTTP
pip install python-dotenv  # gestion des variables d'environnement
```

### üì¶ Installation compl√®te en une commande

```bash
# Cr√©er l'environnement avec tous les packages conda
conda create -n llm python=3.11 numpy pandas matplotlib seaborn scikit-learn jupyter ipykernel notebook requests -y

# Activer
conda activate llm

# Installer PyTorch (CPU)
conda install pytorch torchvision torchaudio cpuonly -c pytorch -y

# Installer les packages Hugging Face et bonus
pip install transformers datasets accelerate tqdm pillow python-dotenv

# Enregistrer l'environnement dans Jupyter
python -m ipykernel install --user --name=llm --display-name="Python (LLM)"
```

---
## 7Ô∏è‚É£ V√©rification des Installations

Ex√©cutez les cellules suivantes pour v√©rifier que tout est bien install√©.

In [None]:
# V√©rification de l'environnement Python
import sys
print(f"Version de Python : {sys.version}")
print(f"Ex√©cutable : {sys.executable}")

In [None]:
# V√©rification des packages Data Science
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

print(f"‚úÖ NumPy version : {np.__version__}")
print(f"‚úÖ Pandas version : {pd.__version__}")
print(f"‚úÖ Matplotlib version : {plt.matplotlib.__version__}")

In [None]:
# V√©rification de scikit-learn
import sklearn
print(f"‚úÖ Scikit-learn version : {sklearn.__version__}")

In [None]:
# V√©rification de PyTorch
import torch
print(f"‚úÖ PyTorch version : {torch.__version__}")
print(f"CUDA disponible : {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"Device CUDA : {torch.cuda.get_device_name(0)}")
else:
    print("Mode CPU (normal si vous n'avez pas de GPU NVIDIA)")

In [None]:
# V√©rification de Transformers (Hugging Face)
import transformers
print(f"‚úÖ Transformers version : {transformers.__version__}")

In [None]:
# Test rapide : cr√©er un petit graphique
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(0, 10, 100)
y = np.sin(x)

plt.figure(figsize=(8, 4))
plt.plot(x, y, label='sin(x)', color='blue', linewidth=2)
plt.xlabel('x')
plt.ylabel('y')
plt.title('Test de Matplotlib : fonction sinus')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

print("‚úÖ Si vous voyez un graphique ci-dessus, Matplotlib fonctionne !")

In [None]:
# Test rapide : cr√©er un DataFrame pandas
import pandas as pd

data = {
    'Nom': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'Ville': ['Paris', 'Lyon', 'Marseille']
}

df = pd.DataFrame(data)
print("‚úÖ Test de Pandas - DataFrame cr√©√© :")
print(df)

In [None]:
# Test rapide : op√©ration avec PyTorch
import torch

# Cr√©er un tenseur
tensor = torch.tensor([[1, 2], [3, 4]], dtype=torch.float32)
print("Tenseur original :")
print(tensor)

# Op√©ration simple
result = tensor * 2 + 1
print("\nApr√®s multiplication par 2 et addition de 1 :")
print(result)

print("\n‚úÖ PyTorch fonctionne correctement !")

### üéâ R√©sum√© des v√©rifications

Si toutes les cellules ci-dessus s'ex√©cutent sans erreur, **f√©licitations !** Votre environnement est pr√™t pour le Machine Learning et les LLM.

**Checklist :**
- ‚úÖ Python install√© et version correcte
- ‚úÖ NumPy, Pandas, Matplotlib fonctionnent
- ‚úÖ Scikit-learn install√©
- ‚úÖ PyTorch install√© (CPU ou GPU)
- ‚úÖ Transformers (Hugging Face) install√©
- ‚úÖ Jupyter fonctionne (vous lisez ce notebook !)

---
## 8Ô∏è‚É£ R√©solution de Probl√®mes Courants

### ‚ùå Probl√®me 1 : "conda n'est pas reconnu"

**Sympt√¥me :** En tapant `conda` dans le terminal, vous obtenez une erreur.

**Solutions :**
1. **Windows :** Utilisez "Anaconda Prompt" au lieu du terminal standard
2. Ajoutez Anaconda au PATH :
   - Cherchez o√π est install√© Anaconda (ex: `C:\Users\VotreNom\anaconda3`)
   - Ajoutez ce chemin aux variables d'environnement
3. R√©installez Anaconda en cochant "Add to PATH"

---

### ‚ùå Probl√®me 2 : "ModuleNotFoundError: No module named 'xxx'"

**Sympt√¥me :** Python ne trouve pas un package que vous avez install√©.

**Causes possibles :**
1. Package install√© dans un autre environnement
2. Jupyter utilise un autre kernel
3. Package mal install√©

**Solutions :**
```bash
# V√©rifier l'environnement actif
conda env list  # L'environnement actif a une √©toile *

# Activer le bon environnement
conda activate llm

# Installer le package dans cet environnement
conda install nom-du-package

# Enregistrer l'environnement dans Jupyter
python -m ipykernel install --user --name=llm

# Relancer Jupyter et s√©lectionner le bon kernel
```

---

### ‚ùå Probl√®me 3 : Installation PyTorch √©choue ou tr√®s lente

**Solutions :**
```bash
# M√©thode 1 : Utiliser pip au lieu de conda
pip install torch torchvision torchaudio

# M√©thode 2 : Utiliser le site officiel PyTorch
# Allez sur https://pytorch.org/get-started/locally/
# S√©lectionnez votre configuration et copiez la commande

# M√©thode 3 : Installer une version sp√©cifique
pip install torch==2.0.0 torchvision==0.15.0 torchaudio==2.0.0
```

---

### ‚ùå Probl√®me 4 : "CondaHTTPError" ou probl√®me de r√©seau

**Sympt√¥me :** Conda ne peut pas t√©l√©charger les packages.

**Solutions :**
```bash
# Nettoyer le cache conda
conda clean --all

# Utiliser un canal diff√©rent
conda install -c conda-forge nom-du-package

# Utiliser pip comme alternative
pip install nom-du-package
```

---

### ‚ùå Probl√®me 5 : Jupyter ne d√©marre pas ou kernel ne se connecte pas

**Solutions :**
```bash
# R√©installer ipykernel
conda install --force-reinstall ipykernel

# Enregistrer le kernel
python -m ipykernel install --user --name=llm

# Lister les kernels disponibles
jupyter kernelspec list

# Supprimer un kernel probl√©matique
jupyter kernelspec remove llm
# Puis r√©enregistrer
```

---

### ‚ùå Probl√®me 6 : Conflit de d√©pendances

**Sympt√¥me :** `conda` passe des heures √† "Solving environment" ou √©choue.

**Solutions :**
```bash
# M√©thode 1 : Utiliser mamba (solver plus rapide)
conda install mamba -c conda-forge
mamba install nom-du-package

# M√©thode 2 : Cr√©er un nouvel environnement
conda create -n llm-new python=3.11
conda activate llm-new
# Installer les packages un par un dans l'ordre

# M√©thode 3 : Utiliser pip pour les packages probl√©matiques
pip install nom-du-package
```

---

### ‚ùå Probl√®me 7 : CUDA non d√©tect√© (pour utilisateurs GPU)

**Sympt√¥me :** `torch.cuda.is_available()` retourne `False`

**Solutions :**
```bash
# V√©rifier la version CUDA install√©e
nvidia-smi

# Installer la bonne version de PyTorch
# Si CUDA 11.8 :
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

# Si CUDA 12.1 :
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

# V√©rifier l'installation
python -c "import torch; print(torch.cuda.is_available())"
```

---

### üÜò Commandes de diagnostic

Ex√©cutez ces commandes pour diagnostiquer les probl√®mes :

In [None]:
# Diagnostic complet de l'environnement
import sys
import os

print("=" * 50)
print("DIAGNOSTIC DE L'ENVIRONNEMENT")
print("=" * 50)

print(f"\nüìç Version Python : {sys.version}")
print(f"üìç Ex√©cutable Python : {sys.executable}")
print(f"üìç Environnement actif : {os.environ.get('CONDA_DEFAULT_ENV', 'Non d√©tect√©')}")

print("\nüì¶ Packages install√©s :")
packages = ['numpy', 'pandas', 'matplotlib', 'sklearn', 'torch', 'transformers']

for pkg in packages:
    try:
        module = __import__(pkg)
        version = getattr(module, '__version__', 'Version inconnue')
        print(f"  ‚úÖ {pkg:15} : {version}")
    except ImportError:
        print(f"  ‚ùå {pkg:15} : NON INSTALL√â")

print("\nüéÆ GPU Info :")
try:
    import torch
    print(f"  CUDA disponible : {torch.cuda.is_available()}")
    if torch.cuda.is_available():
        print(f"  Device : {torch.cuda.get_device_name(0)}")
        print(f"  CUDA version : {torch.version.cuda}")
except:
    print("  PyTorch non install√© ou probl√®me GPU")

print("\n" + "=" * 50)

---
## üìö Ressources Suppl√©mentaires

### Documentation Officielle
- [Anaconda Documentation](https://docs.anaconda.com/)
- [Conda Cheat Sheet](https://docs.conda.io/projects/conda/en/latest/user-guide/cheatsheet.html)
- [PyTorch Installation](https://pytorch.org/get-started/locally/)
- [Hugging Face Transformers](https://huggingface.co/docs/transformers/installation)

### Tutoriels
- [Real Python - Virtual Environments](https://realpython.com/python-virtual-environments-a-primer/)
- [Jupyter Notebook Tutorial](https://jupyter-notebook.readthedocs.io/)

### Communaut√©s
- [Stack Overflow](https://stackoverflow.com/questions/tagged/python)
- [Reddit r/learnpython](https://www.reddit.com/r/learnpython/)
- [Hugging Face Forum](https://discuss.huggingface.co/)

---
## ‚úÖ Checklist Finale

Avant de passer au cours suivant, assurez-vous que :

- [ ] Anaconda est install√© et fonctionne (`conda --version`)
- [ ] Vous comprenez le concept d'environnement virtuel
- [ ] Vous avez cr√©√© l'environnement `llm`
- [ ] Vous savez activer/d√©sactiver un environnement
- [ ] Vous comprenez la diff√©rence entre conda et pip
- [ ] Tous les packages essentiels sont install√©s et test√©s
- [ ] Jupyter Notebook fonctionne avec le bon kernel
- [ ] Vous savez o√π trouver de l'aide en cas de probl√®me

---

## üéØ Prochaine √âtape

Maintenant que votre environnement est pr√™t, vous pouvez passer au **Cours 02 : Les Bases de Python pour le ML**.

Dans le prochain notebook, nous apprendrons :
- Les types de donn√©es Python
- Les structures de contr√¥le
- Les fonctions
- NumPy pour le calcul num√©rique

**Bon apprentissage ! üöÄ**