# üéØ Exercice 1 : Autocompl√©tion GitHub Copilot

## Objectif
Observer et tester comment GitHub Copilot peut compl√©ter automatiquement un script de visualisation √† partir de quelques mots-cl√©s.

## üìÅ Fichiers fournis
- `data.tsv` : donn√©es d'expression g√©nique
- `exercice_copilot.py` : fichier de travail vide o√π vous √©crirez le code
- `consignes.ipynb` : ce fichier avec les instructions d√©taill√©es

## üìä Structure des donn√©es

Le fichier `data.tsv` contient :
```
condition	expression
control	1.5
control	1.8
control	1.3
treatment	3.4
treatment	3.8
treatment	3.5
```

- **condition** : variable cat√©gorielle (control, treatment)
- **expression** : variable num√©rique (niveaux d'expression entre 1-4)
- **Format** : TSV (Tab-Separated Values)

## üöÄ Instructions pas √† pas

### √âtape 1 : Imports
Ouvrez le fichier `exercice_copilot.py` et commencez √† taper :
```python
import pandas
```
üëÄ **Observer** : Copilot devrait sugg√©rer `as pd`

Continuez avec :
```python
import seaborn
import matplotlib
import os
```
üëÄ **Observer** : L'import d'`os` sera n√©cessaire pour g√©rer le chemin du fichier de donn√©es.

### √âtape 2 : Gestion du chemin et chargement des donn√©es
D'abord, g√©rez le chemin du fichier pour qu'il fonctionne depuis n'importe quel r√©pertoire :
```python
script_dir = os.path.dirname(os.path.abspath(__file__))
data_path = os.path.join(script_dir, 'data.tsv')
```
üëÄ **Observer** : Copilot devrait compl√©ter ces lignes automatiquement.

Puis chargez les donn√©es :
```python
df = pd.read_csv(data_path, sep=
```
üëÄ **Observer** : Copilot devrait proposer `sep='\t'` pour un fichier TSV.

**Astuce** : Cette approche garantit que le fichier sera trouv√© m√™me si vous lancez le script depuis la racine du projet.

### √âtape 3 : Exploration rapide
Testez ces d√©buts de ligne :
```python
df.head
df.info
df.describe
```
Copilot devrait compl√©ter avec les parenth√®ses `()`.

### √âtape 4 : Cr√©ation du graphique
Commencez par la taille de la figure :
```python
plt.figure(figsize=
```

Puis le graphique principal :
```python
sns.violin
```
üëÄ **Observer** : Copilot devrait sugg√©rer les bons param√®tres bas√©s sur les colonnes de votre DataFrame.

### √âtape 5 : Personnalisation
Testez ces d√©buts pour les titres et labels :
```python
plt.title('
plt.xlabel('
plt.ylabel('
```

Finalement :
```python
plt.show
```

## üß™ Tests suppl√©mentaires

### Test 1 : Gestion robuste des chemins
Testez votre script en le lan√ßant depuis diff√©rents r√©pertoires :
- Depuis le dossier de l'exercice : `python exercice_copilot.py`
- Depuis la racine du projet : `python Exercices_Copilot/ex1_autocomplete_plot_violin/exercice_copilot.py`

üëÄ **Observer** : Gr√¢ce √† `os.path`, le fichier `data.tsv` devrait √™tre trouv√© dans les deux cas.

### Test 2 : Diff√©rents formats de fichiers
Dans votre code, changez `'data.tsv'` par `'data.csv'` dans la ligne `os.path.join()` et observez si Copilot :
- Supprime le param√®tre `sep='\t'`
- Propose `read_csv` sans param√®tres suppl√©mentaires

### Test 3 : Autres types de graphiques
Essayez de remplacer `sns.violin` par :
- `sns.box` (boxplot)
- `sns.strip` (stripplot)
- `sns.swarm` (swarmplot)

### Test 4 : Statistiques
Tapez `from scipy import` et voyez si Copilot propose des tests statistiques appropri√©s.

## üí° Solution compl√®te (si besoin)

```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import os

# Gestion du chemin relatif au fichier actuel
script_dir = os.path.dirname(os.path.abspath(__file__))
data_path = os.path.join(script_dir, 'data.tsv')

# Chargement des donn√©es
df = pd.read_csv(data_path, sep='\t')

# Exploration
print(df.head())
print(df.info())

# Cr√©ation du graphique
plt.figure(figsize=(8, 6))
sns.violinplot(data=df, x='condition', y='expression')
plt.title('Distribution of Expression Levels by Condition')
plt.xlabel('Experimental Condition')
plt.ylabel('Expression Level')
plt.show()
```

## üéì Points d'apprentissage

### Ce que Copilot fait bien :
- ‚úÖ Reconna√Æt les formats de fichiers (.tsv, .csv)
- ‚úÖ Propose les bonnes fonctions de lecture
- ‚úÖ Sugg√®re des param√®tres appropri√©s (comme `sep='\t'`)
- ‚úÖ Comprend la structure des DataFrames pandas
- ‚úÖ Propose des graphiques coh√©rents avec les donn√©es
- ‚úÖ Aide avec la gestion des chemins (`os.path`, `__file__`)

### Limites observ√©es :
- ‚ùå Peut parfois proposer des noms de colonnes incorrects
- ‚ùå Les suggestions d√©pendent du contexte disponible
- ‚ùå Peut n√©cessiter plusieurs tentatives pour le r√©sultat souhait√©
- ‚ùå N'anticipe pas toujours les probl√®mes de chemins relatifs

### Bonnes pratiques pour optimiser Copilot :
1. **Noms descriptifs** : `df_expression` plut√¥t que `df`
2. **Commentaires clairs** : d√©crivez votre intention
3. **Structure logique** : imports ‚Üí gestion des chemins ‚Üí lecture ‚Üí traitement ‚Üí visualisation
4. **Contexte riche** : gardez les fichiers de donn√©es dans le m√™me dossier
5. **Chemins robustes** : utilisez `os.path` pour la portabilit√©