<a href="https://colab.research.google.com/github/topdeveloppement/ai-nexus-one-machine-learning/blob/main/r%C3%A9gression_lin%C3%A9aire_simple.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<img src="https://gitlab.com/ai-nexus-one-formation/machine-learning/-/raw/main/assets/images/ml.jpeg" alt="AI Nexus One - R√©gression Lin√©aire" />

# üìà R√©gression Lin√©aire : Guide Complet pour D√©butants

<img src="https://github.com/topdeveloppement.png" alt="Photo de l'auteur" width="100"/>

**Auteur :** Omar Kennouche, fondateur de **AI Nexus One**

AI Nexus One est un projet ambitieux d√©di√© √† la formation et au d√©veloppement de solutions en intelligence artificielle, visant √† aider les entreprises √† exploiter pleinement les technologies avanc√©es pour optimiser leurs op√©rations et innover.

---

### √Ä propos de ce Notebook

Ce notebook vous guidera pas √† pas dans la cr√©ation d'un mod√®le de r√©gression lin√©aire. Nous partirons de z√©ro, en g√©n√©rant un jeu de donn√©es synth√©tique, pour ensuite construire, entra√Æner, et √©valuer un mod√®le. Ce guide est con√ßu pour vous fournir une compr√©hension solide des principes fondamentaux de la r√©gression lin√©aire et vous donner les bases pour appliquer ces concepts dans des projets r√©els.

---

### üéØ Objectifs du Notebook

1. **Comprendre les fondements de la r√©gression lin√©aire** : D√©couvrez comment et pourquoi la r√©gression lin√©aire est utilis√©e en machine learning.
2. **Cr√©er et pr√©parer un jeu de donn√©es** : Apprenez √† g√©n√©rer des donn√©es synth√©tiques et √† les pr√©parer pour le mod√®le.
3. **Entra√Æner un mod√®le de r√©gression lin√©aire** : Suivez le processus pour construire un mod√®le qui s‚Äôadapte aux donn√©es.
4. **Comparer et interpr√©ter les fonctions de co√ªt** : Explorez les deux fonctions de co√ªt les plus couramment utilis√©es et comprenez leurs diff√©rences.
5. **Visualiser et analyser les performances du mod√®le** : Visualisez les r√©sultats et apprenez √† interpr√©ter les performances du mod√®le.

> **Conseil** : Prenez le temps de bien lire chaque √©tape et de comprendre les explications pour une meilleure assimilation des concepts. Ce notebook est con√ßu pour √™tre √† la fois informatif et interactif ‚Äî alors n‚Äôh√©sitez pas √† tester, exp√©rimenter et poser des questions en cours de route !

---

En suivant ce guide, vous serez mieux √©quip√© pour aborder d'autres algorithmes de machine learning, avec une solide compr√©hension des bases. Alors, pr√™t(e) √† plonger dans le monde fascinant de la r√©gression lin√©aire ? üöÄ



### Introduction √† la R√©gression Lin√©aire

La r√©gression lin√©aire est une m√©thode statistique permettant de mod√©liser la relation entre deux variables, l'une d√©pendante et l'autre ind√©pendante. Elle cherche √† ajuster une ligne (ou hyperplan en haute dimension) qui minimise l'√©cart entre les pr√©dictions et les valeurs r√©elles.

#### √âquation de la R√©gression Lin√©aire Simple
L'√©quation de base de la r√©gression lin√©aire est :
$$
y = mx + b
$$
o√π :
- **y** : variable d√©pendante (cible ou pr√©diction).
- **x** : variable ind√©pendante (caract√©ristique).
- **m** : coefficient ou pente de la droite, qui indique la variation de **y** pour une variation de **x**.
- **b** : ordonn√©e √† l'origine, ou le point o√π la ligne croise l'axe des y quand x = 0.

La r√©gression lin√©aire cherche √† d√©terminer les valeurs de **m** et **b** qui minimisent l'erreur entre les pr√©dictions et les valeurs r√©elles.
        


### √âtape 1 : Importation des Biblioth√®ques

Nous utilisons les biblioth√®ques suivantes :
- **NumPy** pour les calculs num√©riques et la g√©n√©ration de valeurs al√©atoires.
- **Pandas** pour organiser les donn√©es sous forme de tableau (DataFrame).
- **Matplotlib** pour visualiser les donn√©es avec des graphiques.
- **Scikit-Learn** pour cr√©er et √©valuer le mod√®le de r√©gression lin√©aire.
        

In [None]:

# Importation des biblioth√®ques n√©cessaires
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, mean_absolute_error

print("Les biblioth√®ques ont √©t√© import√©es avec succ√®s.")



### √âtape 2 : Fixer la Graine Al√©atoire

Nous fixons la **graine al√©atoire** pour que les valeurs g√©n√©r√©es soient les m√™mes chaque fois que le code est ex√©cut√©. Cela garantit que le r√©sultat du notebook est **reproductible**, ce qui signifie que n'importe qui peut obtenir les m√™mes r√©sultats en ex√©cutant le code.
        

In [None]:
np.random.seed(42)  # Fixer la graine pour reproductibilit√©


### √âtape 3 : G√©n√©ration d'un Dataset Synth√©tique

Nous allons cr√©er un dataset simulant la relation entre la quantit√© de fertilisant appliqu√© (en kg/ha) et le rendement des cultures (en quintaux/ha). Cette relation est lin√©aire avec une l√©g√®re variation al√©atoire, ce qui refl√®te des fluctuations naturelles dans les donn√©es.
        

In [None]:

n_samples = 50
fertilisant_kg = np.linspace(0, 200, n_samples)
rendement_qt = 10 + 0.1 * fertilisant_kg + np.random.normal(0, 2, n_samples)
dataset = pd.DataFrame({"fertilisant_kg": fertilisant_kg, "rendement_qt": rendement_qt})
dataset.head()


### √âtape 4 : Visualisation du Dataset

In [None]:

plt.figure(figsize=(10, 6))
plt.scatter(dataset["fertilisant_kg"], dataset["rendement_qt"], color="purple")
plt.xlabel("Quantit√© de fertilisant (kg/ha)")
plt.ylabel("Rendement (q/ha)")
plt.title("Relation entre le fertilisant et le rendement")
plt.show()


### √âtape 5 : Pr√©paration des Donn√©es

In [None]:
X = dataset[['fertilisant_kg']].values
y = dataset['rendement_qt'].values

### √âtape 6 : Division des Donn√©es en Ensembles d'Entra√Ænement et de Test

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)


### √âtape 7 : Cr√©ation et Entra√Ænement du Mod√®le de R√©gression Lin√©aire

Nous allons cr√©er et entra√Æner le mod√®le en ajustant une ligne de r√©gression pour nos donn√©es d'entra√Ænement.
        

In [None]:

modele = LinearRegression()
modele.fit(X_train, y_train)

# Afficher les param√®tres du mod√®le
print("Coefficient (pente) :", modele.coef_[0])
print("Ordonn√©e √† l'origine :", modele.intercept_)



### √âtape 8 : Fonction de Co√ªt et √âvaluation du Mod√®le

En r√©gression lin√©aire, la **fonction de co√ªt** mesure l'√©cart entre les valeurs pr√©dites et les valeurs r√©elles.

Deux fonctions de co√ªt courantes sont :
1. **Erreur Quadratique Moyenne (Mean Squared Error, MSE)** :
   $$
   \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (\hat{y}_i - y_i)^2
   $$
2. **Erreur Absolue Moyenne (Mean Absolute Error, MAE)** :
   $$
   \text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |\hat{y}_i - y_i|
   $$

Nous allons calculer les deux erreurs pour √©valuer le mod√®le.
        

In [None]:

y_pred = modele.predict(X_test)

# Calculer les erreurs MSE et MAE
mse = mean_squared_error(y_test, y_pred)
mae = mean_absolute_error(y_test, y_pred)

# Afficher les r√©sultats
print("Erreur Quadratique Moyenne (MSE) :", mse)
print("Erreur Absolue Moyenne (MAE) :", mae)


### √âtape 9 : Visualisation de la Ligne de R√©gression

In [None]:

plt.figure(figsize=(10, 6))
plt.scatter(X_train, y_train, color="blue", label="Donn√©es d'entra√Ænement")
plt.scatter(X_test, y_test, color="green", label="Donn√©es de test")
plt.plot(X_train, modele.predict(X_train), color="red", label="Ligne de r√©gression")
plt.xlabel("Quantit√© de fertilisant (kg/ha)")
plt.ylabel("Rendement (q/ha)")
plt.title("Ligne de r√©gression et donn√©es")
plt.legend()
plt.show()



### Conclusion

Ce notebook vous a permis de suivre chaque √©tape d‚Äôune r√©gression lin√©aire :
1. G√©n√©ration et visualisation des donn√©es.
2. Pr√©paration et s√©paration des donn√©es en ensembles d'entra√Ænement et de test.
3. Cr√©ation et entra√Ænement du mod√®le de r√©gression lin√©aire.
4. √âvaluation du mod√®le √† l'aide des fonctions de co√ªt MSE et MAE.
5. Visualisation des pr√©dictions.

**Auteur :** Omar Kennouche, fondateur de AI Nexus One.
        