# 🎯 Exercice 1 : Autocomplétion GitHub Copilot

## Objectif
Observer et tester comment GitHub Copilot peut compléter automatiquement un script de visualisation à partir de quelques mots-clés.

## 📁 Fichiers fournis
- `data.tsv` : données d'expression génique
- `exercice_copilot.py` : fichier de travail vide où vous écrirez le code
- `consignes.ipynb` : ce fichier avec les instructions détaillées

## 📊 Structure des données

Le fichier `data.tsv` contient :
```
condition	expression
control	1.5
control	1.8
control	1.3
treatment	3.4
treatment	3.8
treatment	3.5
```

- **condition** : variable catégorielle (control, treatment)
- **expression** : variable numérique (niveaux d'expression entre 1-4)
- **Format** : TSV (Tab-Separated Values)

## 🚀 Instructions pas à pas

### Étape 1 : Imports
Ouvrez le fichier `exercice_copilot.py` et commencez à taper :
```python
import pandas
```
👀 **Observer** : Copilot devrait suggérer `as pd`

Continuez avec :
```python
import seaborn
import matplotlib
```

### Étape 2 : Chargement des données
Tapez lentement :
```python
df = pd.read_
```
👀 **Observer** : Copilot devrait proposer `read_csv` ou `read_table` avec les bons paramètres pour un fichier TSV.

**Astuce** : Si Copilot propose `read_csv`, il devrait automatiquement ajouter `sep='\t'` car il voit l'extension `.tsv`.

### Étape 3 : Exploration rapide
Testez ces débuts de ligne :
```python
df.head
df.info
df.describe
```
Copilot devrait compléter avec les parenthèses `()`.

### Étape 4 : Création du graphique
Commencez par la taille de la figure :
```python
plt.figure(figsize=
```

Puis le graphique principal :
```python
sns.violin
```
👀 **Observer** : Copilot devrait suggérer les bons paramètres basés sur les colonnes de votre DataFrame.

### Étape 5 : Personnalisation
Testez ces débuts pour les titres et labels :
```python
plt.title('
plt.xlabel('
plt.ylabel('
```

Finalement :
```python
plt.show
```

## 🧪 Tests supplémentaires

### Test 1 : Différents formats de fichiers
Dans votre code, changez `data.tsv` par `data.csv` et observez si Copilot :
- Supprime le paramètre `sep='\t'`
- Propose `read_csv` sans paramètres supplémentaires

### Test 2 : Autres types de graphiques
Essayez de remplacer `sns.violin` par :
- `sns.box` (boxplot)
- `sns.strip` (stripplot)
- `sns.swarm` (swarmplot)

### Test 3 : Statistiques
Tapez `from scipy import` et voyez si Copilot propose des tests statistiques appropriés.

## 💡 Solution complète (si besoin)

```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# Chargement des données
df = pd.read_csv('data.tsv', sep='\t')

# Exploration
print(df.head())
print(df.info())

# Création du graphique
plt.figure(figsize=(8, 6))
sns.violinplot(data=df, x='condition', y='expression')
plt.title('Distribution of Expression Levels by Condition')
plt.xlabel('Experimental Condition')
plt.ylabel('Expression Level')
plt.show()
```

## 🎓 Points d'apprentissage

### Ce que Copilot fait bien :
- ✅ Reconnaît les formats de fichiers (.tsv, .csv)
- ✅ Propose les bonnes fonctions de lecture
- ✅ Suggère des paramètres appropriés (comme `sep='\t'`)
- ✅ Comprend la structure des DataFrames pandas
- ✅ Propose des graphiques cohérents avec les données

### Limites observées :
- ❌ Peut parfois proposer des noms de colonnes incorrects
- ❌ Les suggestions dépendent du contexte disponible
- ❌ Peut nécessiter plusieurs tentatives pour le résultat souhaité

### Bonnes pratiques pour optimiser Copilot :
1. **Noms descriptifs** : `df_expression` plutôt que `df`
2. **Commentaires clairs** : décrivez votre intention
3. **Structure logique** : imports → lecture → traitement → visualisation
4. **Contexte riche** : gardez les fichiers de données dans le même dossier