# Cellule de texte

### À quoi sert une cellule Markdown ?

Dans une cellule de texte (Markdown), je peux écrire un texte formaté pour 
- commenter mes codes 
- expliquer ce que fait chaque étape de l’analyse  
- décrire le jeu de données et les variables  
- formuler des hypothèses ou des questions de recherche  
- interpréter les résultats (graphiques, tableaux, modèles)  
- structurer le notebook avec des titres et des sections  
- rédiger un mini-rapport directement dans le notebook  

Pour exécuter une cellule, je peux utiliser le symbole du triangle ou taper `Shift + Return`.

In [None]:
# si je veux ecrire un commentaire dans une cellule de calcul j'utilise le symbole dièse
# ce commentaire ne sera pas exécuté par Python
print('Bonjour le monde')  # ceci affiche un message à l'écran
# print('Ceci ne sera pas exécuté')

Bonjour le monde


Pour écrire, j'utilise la commande print. Remarquez la structure de la commande :
print('texte que je veux écrire entre guillemets')

`Le texte est toujours entre guillemets`

In [4]:
#dans une cellule de code Python je peux écrire plusieurs lignes de code
a = 5
b = 10
somme = a + b
print('La somme de', a, 'et', b, 'est', somme)

La somme de 5 et 10 est 15


In [5]:
# Le prompt d'exécution affichera egalement le dernier résultat automatiquement (sans besoin d'utiliser print)
somme * 2

30

Chaque cellule garde les résultats des cellules précédentes jusqu'à ce que l'on redémarre le kernel.

Il peut arriver que l'on doive redémarrer le kernel lorsque le script plante. En ce cas il faudra recommencer à compiler de la premiere cellule. 

Dans une cellule de texte je peux écrire des formules en utilisant le format Latex:

$\chi^2 = \sum_{i=1}^{n} \frac{(O_i - E_i)^2}{E_i}$

# Les bibliotheques

# Introduction aux bibliothèques Python

En Python, les **bibliothèques** sont des ensembles de fonctions et de modules qui permettent de réaliser facilement des tâches spécifiques sans réinventer la roue.

Quelques bibliothèques couramment utilisées :  

- **NumPy** : pour le calcul numérique et la manipulation de tableaux multidimensionnels.  
- **Pandas** : pour la manipulation et l'analyse de données tabulaires.  
- **Matplotlib** et **Seaborn** : pour la visualisation de données.  
- **Scikit-learn** : pour le machine learning et l'analyse statistique.  

Pour utiliser une bibliothèque, on l'importe généralement avec la commande `import`.  
Exemple :  
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

En R, l'équivalent serait de charger un package avec library()

- library(dplyr)
- library(ggplot2)

# Correspondance des bibliothèques R et Python

| Tâche | R | Python |
|-------|---|--------|
| Manipulation de données | dplyr, data.table, tibble | Pandas |
| Calcul numérique | base R, matrix | NumPy |
| Visualisation de données | ggplot2, lattice, plotly | Matplotlib, Seaborn, Plotly |
| Statistiques de base | stats, MASS | SciPy, statsmodels |
| Machine learning | caret, mlr, randomForest | Scikit-learn, XGBoost, LightGBM |
| Séries temporelles | forecast, tsibble | statsmodels, Prophet |
| Traitement de texte / NLP | tm, quanteda | NLTK, spaCy |
| Réseaux et graphes | igraph, network | NetworkX, graph-tool |
| Big Data / calcul distribué | sparklyr, data.table | PySpark, Dask |
| Visualisation interactive | shiny, plotly | Dash, Plotly, Bokeh |



# La grande question: 'c'est où mon fichier?' 

Quand on est perdus dans l'arborescence de notre ordinateur, on peut utiliser la bibliotheque  **`os`** qui permet de **naviguer, créer, supprimer et obtenir des informations sur les fichiers et dossiers** directement depuis Python

In [3]:
import os

In [4]:
# Afficher le répertoire courant
print("Répertoire courant :", os.getcwd())

Répertoire courant : /Users/floriana/Dropbox/INSEGNAMENTO/2026/MethodesAlgorithmiques


In [5]:
# Lister les fichiers dans le répertoire courant
print("Fichiers :", os.listdir('.'))

Fichiers : ['SlidesS1.key', 'Intro2Jupyter.ipynb']


### Vérification de la présence des fichiers de données

Lorsque l'on travaille avec des données en Python, il est **important de vérifier que le fichier de données se trouve dans le répertoire courant** (celui où le script ou le notebook est exécuté).  

Si le fichier n'est pas dans ce répertoire, Python ne pourra pas le trouver et vous obtiendrez une **erreur** lors de la lecture, par exemple avec `pandas.read_csv()`.

Astuce : toujours vérifier l'emplacement des fichiers avant de lancer votre code pour éviter les erreurs de lecture.

### Étapes à suivre

1. **Vérifier le répertoire courant** avec `os.getcwd()`.
2. **Lister les fichiers** présents dans ce répertoire avec `os.listdir('.')`.
3. Si le fichier de données n'y est pas :
   - Déplacer le fichier dans le répertoire courant **manuellement**,
   

# Installation des bibliothèques Python

Avant d'utiliser une bibliothèque en Python, il faut souvent **l'installer** sur votre ordinateur.  
Python utilise généralement **`pip`**, le gestionnaire de packages officiel.

## Installation avec pip

Dans une **célulle du notebook**, on peut installer une bibliothèque comme ceci :

!pip install nom_de_la_bibliotheque