# Algorithme de Baum-Welch

### Import des bibliothéques 

In [1]:
import numpy as np

### Définition de la fonction forward

La fonction forward prend en entrée une séquence d'observations O, une matrice de transition A, une matrice d'émission B et une distribution de probabilité initiale pi. 
Cette fonction calcule l'algorithme de Forward pour cette séquence d'observations, en utilisant les paramètres du modèle MMC spécifiés.

In [2]:
def forward(O, A, B, pi):
    T = len(O)  #  la longueur de la séquence d'observations O
    
    N = A.shape[0]  # le nombre d'états dans le modèle MMC
    
    alpha = np.zeros((T, N))  
    alpha[0,:] = pi * B[:, O[0]]  # initialisation d'alpha
    
    #calculer les valeurs suivantes de la matrice alpha
    for t in range(1,T):
        for j in range(N):
            alpha[t,j] = np.dot(alpha[t-1,:], A[:,j]) * B[j, O[t]]  
    return alpha

### Définition de la fonction backward

La fonction backward prend en entrée une séquence d'observations O, une matrice de transition A et une matrice de probabilités d'émission B.
L'algorithme de Backward est utilisé pour calculer la probabilité d'observer une séquence d'observations donnée, à partir d'un modèle MMC spécifié par les paramètres de transition A et les probabilités d'émission B.

In [3]:
def backward(O, A, B):
    T = len(O)  # la longueur de la séquence d'observations O
    
    N = A.shape[0]  # le nombre d'états dans le modèle MMC
    
    #matrice de zéros pour stocker les valeurs de beta et initialisent la dernière valeur de beta à 1
    beta = np.zeros((T, N))  
    beta[T-1,:] = 1  
    
    #calculer les valeurs de beta à chaque instant de temps
    #Cette formule utilise les valeurs de beta calculées à l'instant de temps t+1 pour calculer les valeurs de beta à l'instant de temps t
    for t in range(T-2, -1, -1):
        for i in range(N):
            beta[t,i] = np.sum(A[i,:] * B[:, O[t+1]] * beta[t+1,:])  # formule de récurrence de l'algorithme de Backward 
    return beta

### Définition de la fonction Baum-Welch

La fonction Baum-Welch prend en entrée une séquence d'observations O, une matrice de transition A, une matrice d'émission B et une distribution initiale de probabilité pi.
Algorithme de Baum-Welch pour entraîner un modèle MMC donné les observations O.

In [4]:
def baum_welch(O, A, B, pi, tol=1e-6, max_iter=1000):
    T = len(O) # la longueur de la séquence d'observations O
    
    N = A.shape[0] # # le nombre d'états dans le modèle MMC
    
    M = B.shape[1] # le nombre possible d'observations à partir de la matrice d'émission B

    # calculer les probabilités alpha et beta à l'aide des fonctions "forward" et "backward"
    alpha = forward(O, A, B, pi)
    beta = backward(O, A, B)

    #  calculer les variables intermédiaires xi et gamma 
    xi = np.zeros((T-1, N, N))
    gamma = alpha * beta / np.sum(alpha[-1,:])

    # calculer log-likelihood of des observations 
    ll_old = np.sum(np.log(np.sum(alpha[-1,:])))
    ll_new = ll_old

    #  initialiser un compteur d'itérations à 0
    it = 0

    # Itèrer jusqu'à atteindre une convergence ou un nombre maximal d'itérations
    while (it < max_iter) and (np.abs(ll_new - ll_old) > tol):
        # calculer xi et gamma.
        for t in range(T-1):
            xi[t,:,:] = A * np.outer(alpha[t,:], beta[t+1,:] * B[:, O[t+1]])
            xi[t,:,:] /= np.sum(xi[t,:,:])
        gamma = alpha * beta / np.sum(alpha[-1,:])

        # mettre à jour pi, A et B 
        pi = gamma[0,:]
        for i in range(N):
            for j in range(N):
                A[i,j] = np.sum(xi[:,i,j]) / np.sum(gamma[:-1,i])
            for k in range(M):
                B[i,k] = np.sum(gamma[:,i] * (O==k)) / np.sum(gamma[:,i])

        # calculer la nouvelle log-likelihood
        alpha = forward(O, A, B, pi)
        ll_old = ll_new
        ll_new = np.sum(np.log(np.sum(alpha[-1,:])))

        # incrémenter le compteur d'itérations
        it += 1

    return ll_new, A, B, pi

## Exemple

In [5]:
# Paramètres du modèle MMC
A = np.array([[0.7, 0.3], [0.4, 0.6]]) # Matrice de transition
B = np.array([[0.2, 0.4, 0.4], [0.5, 0.4, 0.1]]) # Matrice d'émission
pi = np.array([0.6, 0.4]) # Distribution de probabilité initiale

# Séquence d'observation
O = np.array([0, 1, 2, 1, 0])

# Entraînement du modèle MMC sur la séquence d'observation
ll, A_new, B_new, pi_new = baum_welch(O, A, B, pi)

# Calcul de la probabilité de la séquence d'observation
alpha = forward(O, A_new, B_new, pi_new)
p_O_given_lambda = np.sum(alpha[-1,:])

print("Probabilité de la séquence d'observation: P(O|lambda) =", p_O_given_lambda)

Probabilité de la séquence d'observation: P(O|lambda) = 0.0043810048
