# Algoritmo de Viterbi

Este algoritmo utiliza matriz de emissão, transição e probabilidade inicial. Abaixo é utilizado o algoritmo para implementação de um exemplo de três estados ('snow', 'rain' e 'sunshine') durante 14 dias. As entradas são: a sequência de observação baseado apenas na sensação (cadeia OCULTA de Markov, definidos os estados como 'hot' ou 'cold') chamada de "obs", a probabilidade inicial dos três estados não-ocultos (pi), a matriz de transição (a) e a matriz de emissão (b). Com base nessas entradas, a saída é o caminho mais provável. O algoritmo realiza, primeiramente, a multiplicação da probabilidade inicial dos estados não-ocultos pela primeira coluna da matriz de emissão (b). 
Nos passos seguintes é feito um loop para multiplicar pelas outras colunas da matriz de emissão. Em outras palavras, o algoritmo multiplica todas as matrizes e vetores a fim de obter todas as probabilidades possíveis de todos os estados em todos os dias, e por fim rastreia qual o maior valor provável de cada estado dia após dia e realiza o backtrace para mostrar ao usuário qual o melhor caminho (path) provável durante os 14 dias. O algoritmo descrito pode ser visualizado na figura abaixo e logo em seguida, o exemplo.

<img src="images/viterbialgorithm.png" align = "left">

In [23]:
import numpy as np
import pandas as pd # data visualization/analysis

obs_map = {'Cold':0, 'Hot':1}
obs = np.array([1,1,0,1,0,0,1,0,1,1,0,0,0,1]) # observable sequence

inv_obs_map = dict((v,k) for k, v in obs_map.items())
obs_seq = [inv_obs_map[v] for v in list(obs)]

In [24]:
print("Simulated Observations:\n",pd.DataFrame(np.column_stack([obs, obs_seq]),columns=['Obs_code', 'Obs_seq']))

Simulated Observations:
    Obs_code Obs_seq
0         1     Hot
1         1     Hot
2         0    Cold
3         1     Hot
4         0    Cold
5         0    Cold
6         1     Hot
7         0    Cold
8         1     Hot
9         1     Hot
10        0    Cold
11        0    Cold
12        0    Cold
13        1     Hot


In [25]:
pi = [0.6, 0.4] # initial probabilities vector
states = ['Cold', 'Hot']
hidden_states = ['Snow', 'Rain', 'Sunshine']
pi = [0, 0.2, 0.8] # initial probabilities vector from hidden_states
state_space = pd.Series(pi, index=hidden_states, name='states')
a_df = pd.DataFrame(columns=hidden_states, index=hidden_states)
a_df.loc[hidden_states[0]] = [0.3, 0.3, 0.4] # df.loc - first row from the vector in position 0
a_df.loc[hidden_states[1]] = [0.1, 0.45, 0.45]
a_df.loc[hidden_states[2]] = [0.2, 0.3, 0.5] # matrix
print("\n HMM matrix:\n", a_df)
a = a_df.values


 HMM matrix:
          Snow  Rain Sunshine
Snow      0.3   0.3      0.4
Rain      0.1  0.45     0.45
Sunshine  0.2   0.3      0.5


In [26]:
observable_states = states
b_df = pd.DataFrame(columns=observable_states, index=hidden_states)
b_df.loc[hidden_states[0]] = [1,0]
b_df.loc[hidden_states[1]] = [0.8,0.2]
b_df.loc[hidden_states[2]] = [0.3,0.7]
print("\n Emission  matrix:\n",b_df) # matrix based on markov chain (transition probability matrix)
b = b_df.values


 Emission  matrix:
          Cold  Hot
Snow        1    0
Rain      0.8  0.2
Sunshine  0.3  0.7


In [27]:
def viterbi(pi, a, b, obs):
    
    nStates = np.shape(b)[0] # qtde de estados
    T = np.shape(obs)[0] # quantidade de dias observados
    
    # init blank path
    path = np.zeros(T,dtype=int) # retorna array preenchido com zeros e do tamanho capturado de T
    # delta --> highest probability of any path that reaches state i
    delta = np.zeros((nStates, T)) # retorna array de zeros do tamanho da quantidade de estados X qtde de dias observados
    # phi --> argmax by time step for each state
    phi = np.zeros((nStates, T)) # qtde de estados X qtde de dias observados
    
    # init delta and phi 
    delta[:, 0] = pi * b[:, obs[0]] # multiplica a prob. inicial pelo primeiro valor da matriz b no primeiro dia de observação
    phi[:, 0] = 0 

    print('\nStart Walk Forward\n')    
    # the forward algorithm extension
    for t in range(1, T): # do primeiro dia ao 14o
        for s in range(nStates): # do primeiro estado ao último
            delta[s, t] = np.max(delta[:, t-1] * a[:, s]) * b[s, obs[t]] # s = qtde de estados (3) t = qtde de dias (14)
            phi[s, t] = np.argmax(delta[:, t-1] * a[:, s])
            print('s={s} and t={t}: phi[{s}, {t}] = {phi}'.format(s=s, t=t, phi=phi[s, t])) # visualizar os argumentos p/ estados
    
    #find optimal path
    print('-'*50)
    print('Start Backtrace\n') # procura maior valor para phi nos 14 dias e nos três estados
    path[T-1] = np.argmax(delta[:, T-1])
    for t in range(T-2, -1, -1): # começa em T-2 (dia 12) para em -1 (dia 0) e passos de 1 em 1 dia
        path[t] = phi[path[t+1], [t+1]] 
        print('path[{}] = {}'.format(t, path[t]))
        
    return path, delta, phi

In [28]:
path, delta, phi = viterbi(pi, a, b, obs)
state_map = {0:'Snow', 1:'Rain', 2:'Sunshine'}
state_path = [state_map[v] for v in path]
pd.DataFrame().assign(Observation=obs_seq).assign(Best_Path=state_path)


Start Walk Forward

s=0 and t=1: phi[0, 1] = 2.0
s=1 and t=1: phi[1, 1] = 2.0
s=2 and t=1: phi[2, 1] = 2.0
s=0 and t=2: phi[0, 2] = 2.0
s=1 and t=2: phi[1, 2] = 2.0
s=2 and t=2: phi[2, 2] = 2.0
s=0 and t=3: phi[0, 3] = 0.0
s=1 and t=3: phi[1, 3] = 1.0
s=2 and t=3: phi[2, 3] = 1.0
s=0 and t=4: phi[0, 4] = 2.0
s=1 and t=4: phi[1, 4] = 2.0
s=2 and t=4: phi[2, 4] = 2.0
s=0 and t=5: phi[0, 5] = 0.0
s=1 and t=5: phi[1, 5] = 1.0
s=2 and t=5: phi[2, 5] = 1.0
s=0 and t=6: phi[0, 6] = 0.0
s=1 and t=6: phi[1, 6] = 1.0
s=2 and t=6: phi[2, 6] = 1.0
s=0 and t=7: phi[0, 7] = 2.0
s=1 and t=7: phi[1, 7] = 2.0
s=2 and t=7: phi[2, 7] = 2.0
s=0 and t=8: phi[0, 8] = 0.0
s=1 and t=8: phi[1, 8] = 1.0
s=2 and t=8: phi[2, 8] = 1.0
s=0 and t=9: phi[0, 9] = 2.0
s=1 and t=9: phi[1, 9] = 2.0
s=2 and t=9: phi[2, 9] = 2.0
s=0 and t=10: phi[0, 10] = 2.0
s=1 and t=10: phi[1, 10] = 2.0
s=2 and t=10: phi[2, 10] = 2.0
s=0 and t=11: phi[0, 11] = 0.0
s=1 and t=11: phi[1, 11] = 1.0
s=2 and t=11: phi[2, 11] = 1.0
s=0 and t=

Unnamed: 0,Observation,Best_Path
0,Hot,Sunshine
1,Hot,Sunshine
2,Cold,Rain
3,Hot,Sunshine
4,Cold,Rain
5,Cold,Rain
6,Hot,Sunshine
7,Cold,Rain
8,Hot,Sunshine
9,Hot,Sunshine
