 Introduction à la Statistique et à la Programmation Scientifique en Python

📌 Plan du Notebook :
Introduction

1. Moyenne, Variance et Écart-Type

2. Analyse de Régression Linéaire

3. Optimisation de Fonctions

3. Chargement et Enregistrement de Données

4. Visualisation de Données

5. Fonctions et Procédures en Python

6. Conclusion



<a name="intro"></a>🔹 1. Introduction

In [10]:
print("Bienvenue dans ce laboratoire Python. Nous allons explorer des concepts essentiels en statistiques et programmation scientifique.")


Bienvenue dans ce laboratoire Python. Nous allons explorer des concepts essentiels en statistiques et programmation scientifique.


La statistique descriptive est une branche de la statistique qui a pour objectif de résumer, organiser et présenter les données d’un échantillon ou d’une population, sans tirer de conclusions au-delà des données observées

![image.png](attachment:image.png)

<a name="moyenne"></a>🔹 2. Moyenne, Variance, Écart-Type


📖 Théorie :

. Moyenne (mean) : somme des valeurs divisée par le nombre d'observations.

. Variance : moyenne des carrés des écarts à la moyenne.

. Écart-type : racine carrée de la variance.

2.1 Moyenne

![image.png](attachment:image.png)

2.2 Variance & Écart-type

![image.png](attachment:image.png)

![image.png](attachment:image.png)

In [12]:
data = [2, 4, 4, 4, 5, 5, 7, 9]

In [None]:
def mean(data):
    return sum(data) / len(data)

def variance(data):
    m = mean(data)
    return sum((x - m) ** 2 for x in data) / len(data)

def standard_deviation(data):
    return variance(data) ** 0.5

# Exemple
data = [2, 4, 4, 4, 5, 5, 7, 9]
print("Moyenne:", mean(data))
print("Variance:", variance(data))
print("Écart-type:", standard_deviation(data))


Moyenne: 5.0
Variance: 4.0
Écart-type: 2.0


📚 Avec NumPy— Définition

NumPy (Numerical Python) est une bibliothèque fondamentale pour le calcul scientifique en Python. Elle permet de travailler efficacement avec :

a. Des tableaux multidimensionnels (appelés ndarray),

b. Des fonctions mathématiques rapides et vectorisées,

c. Des opérations sur matrices, statistiques, algèbre linéaire, etc.

In [15]:
import numpy as np

data_np = np.array(data)
print("Moyenne (numpy):", np.mean(data_np))
print("Variance (numpy):", np.var(data_np))
print("Écart-type (numpy):", np.std(data_np))


Moyenne (numpy): 5.0
Variance (numpy): 4.0
Écart-type (numpy): 2.0


<a name="regression"></a>🔹 3. Analyse de Régression Linéaire

Définition: L’analyse de régression est une technique statistique utilisée pour modéliser la relation entre une variable dépendante (à prédire) et une ou plusieurs variables indépendantes (explicatives).

![image.png](attachment:image.png)

![image.png](attachment:image.png)

In [None]:
def linear_regression(x, y):
............
    return a, b

# Exemple
x = [1, 2, 3, 4, 5]
y = [2, 4, 5, 4, 5]




y = 2.20 + 0.60x


In [None]:
from sklearn.linear_model import LinearRegression
import numpy as np




Coefficient (b): 0.6
Intercept (a): 2.2


<a name="optimisation"></a>🔹 4. Optimisation de Fonctions


L’optimisation de fonctions consiste à trouver les valeurs des variables qui minimisent ou maximisent une fonction donnée.
En science des données et en intelligence artificielle, on cherche souvent à minimiser une fonction de coût ou maximiser un score (ex : précision, profit).


📖 Théorie :
Chercher à minimiser ou maximiser une fonction.

✏️ : Gradient Descent pour minimiser 

f(x)=(x−3) 
2

![image.png](attachment:image.png)

In [None]:
def gradient_descent(start, learning_rate, n_iterations):
    .................
    return x




Minimum de f(x): 2.9999999993888893


In [None]:
from scipy.optimize import minimize

def f(x):
    return ..........




Minimum (scipy): 2.9999999840660854


In [None]:
import numpy as np
from scipy import optimize
import matplotlib.pyplot as plt

# 1. Définition de la fonction à optimiser
def f(x):
    """Fonction quadratique: f(x) = (x-3)^2 + 5"""
    return ..............

<a name="data_io"></a>🔹 5. Chargement et Enregistrement de Données


Définition
Le chargement de données consiste à lire des données à partir d’une source externe (fichier CSV, Excel, base de données, etc.) pour les analyser dans un script Python.
La sauvegarde permet de stocker les résultats d’un traitement ou les données modifiées vers un fichier pour une réutilisation ultérieure.



![image.png](attachment:image.png)

<a name="visualisation"></a>🔹 6. Visualisation de Données


![image.png](attachment:image.png)


![image-2.png](attachment:image-2.png)

📊 Matplotlib


Matplotlib est la bibliothèque Python la plus utilisée pour créer des graphiques 2D. Elle permet de générer :

Des graphiques en lignes, barres, histogrammes,

Des scatter plots (nuages de points),

Des graphiques en secteurs, etc.

Matplotlib offre un contrôle fin sur l’apparence des graphiques (axes, légendes, titres, couleurs, styles) et peut être utilisée de façon simple (avec pyplot) ou avancée (graphiques multi-axes, animations).

📊 Seaborn

Seaborn est une bibliothèque Python basée sur Matplotlib, qui facilite la création de visualisations statistiques attractives et informatives. Elle propose :

Des graphiques statistiques avancés (boxplots, violons, heatmaps),

Une intégration facile avec des DataFrames Pandas,

Des styles graphiques par défaut esthétiques et modernes,

Des fonctions pour analyser la distribution, la relation et la catégorisation des données.

Seaborn est idéale pour explorer les données et obtenir rapidement des graphiques statistiques.

<a name="fonctions"></a>🔹 7. Fonctions et Procédures en Python

📖 Théorie : Qu’est-ce qu’une fonction ou une procédure ?

Fonction : Un bloc de code réutilisable qui prend des entrées (paramètres), effectue des opérations, puis retourne une valeur.

Procédure : Un bloc de code réutilisable qui fait une opération mais ne retourne pas nécessairement une valeur (ou retourne None par défaut en Python).

En Python, les fonctions ET procédures sont définies avec le mot-clé def. La différence est que les procédures ne contiennent pas d'instruction return (ou en renvoient pas explicitement une valeur).

In [None]:
def nom_de_la_fonction(param1, param2, ...):
    # corps de la fonction : instructions
    return resultat  # optionnel, selon que la fonction retourne une valeur


🔹 Exemple simple de fonction

In [31]:
def carre(x):
    """Retourne le carré d'un nombre."""
    return x * x

resultat = carre(5)
print("Le carré de 5 est :", resultat)


Le carré de 5 est : 25
