<a href="https://colab.research.google.com/github/Amadou794545/CahierDeCharge/blob/main/CahierDeCharge.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn.metrics import mean_squared_error

**Algorithme de descente de gradient**

La descente de gradient est une technique mathématique qui permet de trouver de manière itérative les pondérations et les biais qui produisent le modèle avec la perte la plus faible . La descente de gradient permet de trouver la meilleure pondération et le meilleur biais en répétant le processus suivant pour un certain nombre d'itérations définies par l'utilisateur.

savoir mathématique:

xt+1= xt– η∆xt

In [1]:

def gradient_descent(X, y, learning_rate=0.01, n_iterations=1000):
    n_samples, n_features = X.shape
    theta = np.zeros(n_features)
    for _ in range(n_iterations):
        gradient = (2/n_samples) * X.T.dot(X.dot(theta) - y)
        theta -= learning_rate * gradient
    return theta

# Exemple d'utilisation
X = np.array([[1, 2], [2, 3], [3, 4]])
y = np.array([5, 7, 9])
theta = gradient_descent(X, y)
print("Paramètres optimaux :", theta)

Paramètres optimaux : [-0.18234281  2.43336318]


**Régression par force brute**

La régression par force brute est une méthode simple mais coûteuse en calcul pour trouver les paramètres optimaux d'un modèle de régression. Contrairement à des méthodes plus sophistiquées comme la descente de gradient, la force brute consiste à évaluer la fonction de coût pour un grand nombre de combinaisons de paramètres et à choisir celle qui minimise cette fonction.

J(θ)=∑
i=1
n
​
 (y
i
​
 −X
i
​
 θ)
2

In [6]:
from itertools import product
import numpy as np

def brute_force_regression(X, y, param_range):
    best_theta, best_error = None, float('inf')
    for theta in product(param_range, repeat=X.shape[1]):
        error = np.sum((X.dot(theta) - y) ** 2)
        if error < best_error:
            best_theta, best_error = theta, error
    return best_theta

# Exemple d'utilisation
X = np.array([[1, 2], [2, 3], [3, 4]])
y = np.array([5, 7, 9])
param_range = np.linspace(-10, 10, 100)
theta = brute_force_regression(X, y, param_range)
print("Paramètres optimaux :", theta)

Paramètres optimaux : (-0.9090909090909101, 2.929292929292929)


**Methode des moindre carré**

La méthode des moindres carrés est utilisée pour ajuster un modèle linéaire en minimisant la somme des carrés des erreurs entre les valeurs prédites et les valeurs réelles.

θ=(X
T
 X)
−1
 X
T
 y

In [3]:
def least_squares(X, y):
    theta = np.linalg.inv(X.T.dot(X)).dot(X.T).dot(y)
    return theta

# Exemple d'utilisation
X = np.array([[1, 2], [2, 3], [3, 4]])
y = np.array([5, 7, 9])
theta = least_squares(X, y)
print("Paramètres optimaux :", theta)

Paramètres optimaux : [-1.  3.]


**Regression lineaire**

La régression linéaire est l'une des méthodes les plus fondamentales et les plus utilisées en statistiques et en apprentissage automatique. Elle permet de modéliser la relation entre une variable dépendante (ou cible)
Y
Y et une ou plusieurs variables indépendantes (ou caractéristiques)
X
X. L'objectif est de trouver une relation linéaire qui prédit
Y
Y en fonction de
X
X.

θ=(X
T
 X)
−1
 X
T
 Y

In [7]:
from sklearn.linear_model import LinearRegression

# Exemple d'utilisation
X = np.array([[1, 2], [2, 3], [3, 4]])
y = np.array([5, 7, 9])
model = LinearRegression()
model.fit(X, y)
print("Paramètres optimaux :", model.coef_)

Paramètres optimaux : [1. 1.]


**Régression Polynomiale**

La régression polynomiale modélise la relation entre les variables indépendantes et la variable dépendante par un polynôme.

y=θ
0
​
 +θ
1
​
 x+θ
2
​
 x
2
 +⋯+θ
d
​
 x
d
 +ϵ

In [8]:
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression

# Exemple d'utilisation
X = np.array([[1], [2], [3]])
y = np.array([5, 7, 9])
poly = PolynomialFeatures(degree=2)
X_poly = poly.fit_transform(X)
model = LinearRegression()
model.fit(X_poly, y)
print("Paramètres optimaux :", model.coef_)

Paramètres optimaux : [ 0.00000000e+00  2.00000000e+00 -1.99840144e-15]


**Arbre de Décision**

Un arbre de décision divise récursivement l'espace des données en sous-ensembles basés sur des conditions.

Impureté de Gini :
G
=
1
−
∑
i
=
1
k
p
i
2
G=1−∑
i=1
k
​
 p
i
2
​


In [9]:
from sklearn.tree import DecisionTreeRegressor

# Exemple d'utilisation
X = np.array([[1, 2], [2, 3], [3, 4]])
y = np.array([5, 7, 9])
model = DecisionTreeRegressor()
model.fit(X, y)
print("Prédiction :", model.predict([[4, 5]]))

Prédiction : [9.]


**Random Forest**

Un Random Forest est un ensemble d'arbres de décision qui combine leurs prédictions pour améliorer la performance.

In [10]:
from sklearn.ensemble import RandomForestRegressor

# Exemple d'utilisation
X = np.array([[1, 2], [2, 3], [3, 4]])
y = np.array([5, 7, 9])
model = RandomForestRegressor()
model.fit(X, y)
print("Prédiction :", model.predict([[4, 5]]))

Prédiction : [8.48]


**Régression Logistique**

La régression logistique modélise la probabilité qu'une instance appartienne à une classe.



Fonction logistique :
P
(
y
=
1
∣
X
)
=
1
1
+
e
−
X
θ
P(y=1∣X)=
1+e
−Xθ



Fonction de coût :
J
(
θ
)
=
−
1
n
∑
i
=
1
n
[
y
i
log
⁡
(
P
(
y
i
)
)
+
(
1
−
y
i
)
log
⁡
(
1
−
P
(
y
i
)
)
]
J(θ)=−
n
1
​
 ∑
i=1
n
​
 [y
i
​
 log(P(y
i
​
 ))+(1−y
i
​
 )log(1−P(y
i
​
 ))]

In [11]:
from sklearn.linear_model import LogisticRegression

# Exemple d'utilisation
X = np.array([[1, 2], [2, 3], [3, 4]])
y = np.array([0, 1, 0])
model = LogisticRegression()
model.fit(X, y)
print("Prédiction :", model.predict([[4, 5]]))

Prédiction : [0]


K-Nearest Neighbours (KNN)

KNN classe une instance en fonction des classes de ses k plus proches voisins.



In [12]:
from sklearn.neighbors import KNeighborsClassifier

# Exemple d'utilisation
X = np.array([[1, 2], [2, 3], [3, 4]])
y = np.array([0, 1, 0])
model = KNeighborsClassifier(n_neighbors=3)
model.fit(X, y)
print("Prédiction :", model.predict([[4, 5]]))

Prédiction : [0]


K-Means

K-Means partitionne les données en k clusters en minimisant la variance intra-cluster.



Fonction de coût :
J
=
∑
i
=
1
k
∑
x
∈
C
i
∥
x
−
μ
i
∥
2
J=∑
i=1
k
​
 ∑
x∈C
i
​

​
 ∥x−μ
i
​
 ∥
2
 , où
μ
i
μ
i
​
  est le centroïde du cluster
C
i
C
i
​
 .

Algorithme : Minimise
J
J en alternant l'affectation des points aux clusters et la mise à jour des centroïdes

In [13]:
from sklearn.cluster import KMeans

# Exemple d'utilisation
X = np.array([[1, 2], [2, 3], [3, 4]])
model = KMeans(n_clusters=2)
model.fit(X)
print("Clusters :", model.labels_)

Clusters : [0 0 1]


Mean-Shift

Mean-Shift identifie les clusters en déplaçant itérativement les points vers le mode de la distribution.

In [14]:
from sklearn.cluster import MeanShift

# Exemple d'utilisation
X = np.array([[1, 2], [2, 3], [3, 4]])
model = MeanShift()
model.fit(X)
print("Clusters :", model.labels_)

Clusters : [2 1 0]


Modèles de Mélange Gaussien (GMM)
Distribution : Modélise les données comme un mélange de distributions gaussiennes.

Fonction de vraisemblance :
P
(
X
∣
θ
)
=
∑
i
=
1
k
π
i
N
(
X
∣
μ
i
,
Σ
i
)
P(X∣θ)=∑
i=1
k
​
 π
i
​
 N(X∣μ
i
​
 ,Σ
i
​
 ), où
π
i
π
i
​
  est le poids de la composante
i
i.

Méthode Bayésienne
Théorème de Bayes :
P
(
y
∣
X
)
=
P
(
X
∣
y
)
P
(
y
)
P
(
X
)
P(y∣X)=
P(X)
P(X∣y)P(y)
​
 .

Classification : Choisit la classe
y
y qui maximise
P
(
y
∣
X
)
P(y∣X).



Machines à Vecteurs de Support (SVM)
Hyperplan : Trouve l'hyperplan
w
T
x
+
b
=
0
w
T
 x+b=0 qui maximise la marge entre les classes.

Fonction de coût :
min
⁡
1
2
∥
w
∥
2
+
C
∑
i
=
1
n
max
⁡
(
0
,
1
−
y
i
(
w
T
x
i
+
b
)
)
min
2
1
​
 ∥w∥
2
 +C∑
i=1
n
​
 max(0,1−y
i
​
 (w
T
 x
i
​
 +b)).