### Ex. 1. Pe baza definiţiei unui model Markov ascuns, demonstraţi formula recurenţei pentru variabila forward de la pagina 23 a cursului 4. Încărcaţi argumentul fie în Markdown/Latex, fie ca foto la foia de lucru.


Pentru a demonstra formula recurenței pentru variabila forward, să ne reamintim că variabila forward $ \alpha_t(i) $ reprezintă probabilitatea de a fi în starea ascunsă **i** la momentul **t**, având în vedere observațiile $ O_1, O_2, \ldots, O_t $. Adică:

$$
\alpha_t(i) = P(O_1, O_2, \ldots, O_t, X_t = i)
$$

Formula recurenței pentru variabila forward este:

$$
\alpha_{t+1}(j) = \left( \sum_{i=1}^N \alpha_t(i) \cdot a_{ij} \right) \cdot b_j(O_{t+1})
$$

unde:
- **$a_{ij}$** este probabilitatea de tranziție de la starea **$i$** la starea **$j$**,
- **$b_j(O_{t+1})$** este probabilitatea ca starea **$j$** să genereze observația *$O_{t+1}$*.

### Demonstrația formulei recurenței forward

1. **Definirea probabilității forward**: La momentul $ t+1 $, probabilitatea de a observa secvența $ O_1, O_2, \ldots, O_{t+1} $ și de a fi în starea ascunsă $ j $ este dată de variabila forward $ \alpha_{t+1}(j) $.

2. **Determinarea probabilităților pentru toate tranzițiile posibile**: Pentru a ajunge în starea $ j $ la momentul $ t+1 $, sistemul poate trece din oricare dintre stările $ i = 1, 2, \ldots, N $ la momentul $ t $ în starea $ j $ la momentul $ t+1 $. Astfel, trebuie să adunăm contribuțiile tuturor stărilor anterioare.

3. **Calculul probabilității pentru fiecare tranziție**:
   - Probabilitatea de a fi în starea $ i $ la momentul $ t $ și de a observa secvența $ O_1, O_2, \ldots, O_t $ este $ \alpha_t(i) $.
   - Probabilitatea de a face tranziția de la starea $ i $ la starea $ j $ este $ a_{ij} $.
   - Probabilitatea ca starea $ j $ să genereze observația $ O_{t+1} $ este $ b_j(O_{t+1}) $.

4. **Concluzie**: Prin urmare, formula recurenței forward este:

$$
\alpha_{t+1}(j) = \left( \sum_{i=1}^N \alpha_t(i) \cdot a_{ij} \right) \cdot b_j(O_{t+1})
$$

Această formulă este obținută prin adunarea tuturor probabilităților de a ajunge în starea $ j $ la momentul $ t+1 $ din toate stările posibile la momentul $ t $, multiplicând cu probabilitatea observației corespunzătoare.


### Ex. 2. Reluaţi exerciţiul de la laborator, de data aceasta implementând direct alogritmul Viterbi descris în cursul 4. Mai jos redăm enunţul acestuia:
Un profesor dă teste care pot fi dificile, medii sau uşoare. Probabilitatea dificultăţii primului test este aceeaşi. Dacă, la un moment dat, dă un test dificil, următorul test poate fi doar mediu sau uşor, cu aceeaşi probabilitate. Însă dacă dă un test mediu sau uşor, atunci următorul test va fi dificil cu probabilitate 0.5, sau mediu sau uşor cu aceeaşi probabilitate, 0.25.


Nota unui student la test, FB, B, S sau NS depinde de dificultatea testului. Astfel, probabilităţile condiţionate ale notei
obţinute, dată fiind dificultatea testului, sunt:
  - test dificil: [0.1, 0.2, 0.4, 0.3];
  - test mediu: [0.15, 0.25, 0.5, 0.1];
  - test uşor: [0.2, 0.3, 0.4, 0.1].
  
Să presupunem că aţi observat următoarea secvenţă de note: FB, FB, S, B, B, S, B, B, NS, B, B, S. Determinaţi cea mai
probabilă secvenţă de dificultăţi pentru testele corespunzaătoare şi probabilitatea acesteia.

Vom implementa algoritmul Viterbi, care este folosit pentru a determina cea mai probabilă secvență de stări ascunse date o secvență de observații.

### Pasul 1: Definirea modelului

1. **Stările posibile (dificultățile testelor)**:
   - Dificil (D)
   - Mediu (M)
   - Ușor (U)

2. **Observațiile posibile (notele obținute)**:
   - FB (Foarte Bine)
   - B (Bine)
   - S (Satisfăcător)
   - NS (Nesatisfăcător)

3. **Probabilitățile de tranziție**:
   - $ P(D \to D) = 0 $
   - $ P(D \to M) = 0.5 $
   - $ P(D \to U) = 0.5 $
   - $ P(M \to D) = 0.5 $
   - $ P(M \to M) = 0.25 $
   - $ P(M \to U) = 0.25 $
   - $ P(U \to D) = 0.5 $
   - $ P(U \to M) = 0.25 $
   - $ P(U \to U) = 0.25 $

4. **Probabilitățile emiterii**:
   - Dificil: $ [0.1, 0.2, 0.4, 0.3] $ (probabilitățile pentru FB, B, S, NS)
   - Mediu: $ [0.15, 0.25, 0.5, 0.1] $
   - Ușor: $ [0.2, 0.3, 0.4, 0.1] $

5. **Secvența de observații**:
   - FB, FB, S, B, B, S, B, B, NS, B, B, S

### Pasul 2: Implementarea algoritmului Viterbi

Implementez o funcție Python pentru a implementa algoritmul Viterbi și pentru a calcula cea mai probabilă secvență de dificultăți pentru testele corespunzătoare.

In [6]:
import numpy as np

# Definirea stărilor și observațiilor
states = ['D', 'M', 'U']  # Stările posibile: Dificil, Mediu, Ușor
observations = ['FB', 'B', 'S', 'NS']  # Observațiile: Foarte Bine, Bine, Satisfăcător, Nesatisfăcător

# Probabilitățile de tranziție între stări conform enunțului
transition_probs = {
    'D': {'D': 0, 'M': 0.5, 'U': 0.5},
    'M': {'D': 0.5, 'M': 0.25, 'U': 0.25},
    'U': {'D': 0.5, 'M': 0.25, 'U': 0.25},
}

# Probabilitățile de emisie pentru fiecare stare
emission_probs = {
    'D': {'FB': 0.1, 'B': 0.2, 'S': 0.4, 'NS': 0.3},  # Probabilitățile pentru fiecare observație în stare Dificil
    'M': {'FB': 0.15, 'B': 0.25, 'S': 0.5, 'NS': 0.1},  # Probabilitățile pentru fiecare observație în stare Mediu
    'U': {'FB': 0.2, 'B': 0.3, 'S': 0.4, 'NS': 0.1},    # Probabilitățile pentru fiecare observație în stare Ușor
}

# Observațiile date de enunț
observed_sequence = ['FB', 'FB', 'S', 'B', 'B', 'S', 'B', 'B', 'NS', 'B', 'B', 'S']

# Algoritmul Viterbi
def viterbi(observations, states, transition_probs, emission_probs):
    n_states = len(states)
    n_observations = len(observations)

    # Inițializare: matricea Viterbi și backpointer-ul
    viterbi_matrix = np.zeros((n_states, n_observations))
    backpointer = np.zeros((n_states, n_observations), dtype=int)

    # Probabilitatea inițială este egală pentru toate stările (1 / numărul de stări)
    initial_prob = 1 / n_states
    for s in range(n_states):
        viterbi_matrix[s, 0] = initial_prob * emission_probs[states[s]][observations[0]]

    # Recursia Viterbi
    for t in range(1, n_observations):
        for s in range(n_states):
            max_prob = -1
            max_state = -1
            for s_prev in range(n_states):
                prob = (
                    viterbi_matrix[s_prev, t-1] *
                    transition_probs[states[s_prev]][states[s]] *
                    emission_probs[states[s]][observations[t]]
                )
                if prob > max_prob:
                    max_prob = prob
                    max_state = s_prev
            viterbi_matrix[s, t] = max_prob
            backpointer[s, t] = max_state

    # Reconstruirea celei mai probabile secvențe folosind backpointer-ul
    best_path = []
    best_last_state = np.argmax(viterbi_matrix[:, n_observations - 1])
    best_path.append(states[best_last_state])

    for t in range(n_observations - 1, 0, -1):
        best_last_state = backpointer[best_last_state, t]
        best_path.append(states[best_last_state])

    best_path.reverse()
    return best_path, viterbi_matrix[:, -1].max()

# Executăm algoritmul Viterbi pentru secvența observată
best_path, best_path_prob = viterbi(observed_sequence, states, transition_probs, emission_probs)

# Afișarea rezultatelor
print("Cea mai probabilă secvență de dificultăți:", best_path)
print("Probabilitatea secvenței:", best_path_prob)

Cea mai probabilă secvență de dificultăți: ['D', 'U', 'D', 'U', 'D', 'M', 'D', 'U', 'D', 'U', 'D', 'M']
Probabilitatea secvenței: 2.1093750000000005e-11
