In [56]:
import numpy as np
import random as rnd
from tqdm import tqdm

In [57]:
def forward(A, B, pi, sequence, eval=False):
    T = len(sequence)
    N = A.shape[0]
    alpha = np.zeros((N, T))
    alpha[:, 0] = pi * B[:, sequence[0]]
    constant = np.ones(T)
    if not eval:
        constant[0] = 1/np.sum(alpha[:, 0])
        alpha[:, 0] *= constant[0]
    for i in range(1, T):
        alpha[:, i] = (alpha[:, i-1] @ A) * B[:, sequence[i]]
        if not eval:
            constant[i] = 1/np.sum(alpha[:, i])
            alpha[:, i] *= constant[i]
    return alpha, constant

def backward(A, B, sequence, constant, eval=False):
    T = len(sequence)
    N = A.shape[0]
    beta = np.zeros((N, T))
    beta[:, -1] = 1
    if not eval:
        beta[:, -1] *= constant[-1]
    for i in range(T-1)[::-1]:
        beta[:, i] = A @ (B[:, sequence[i+1]] * beta[:, i+1])
        if not eval:
            beta[:, i] *= constant[i]
    return beta

In [58]:
def init_hmm_params(num_states, num_observations):
    
    # Init transition matrix with regards to the given map
    A = np.zeros((num_states, num_states))
    A[0, [0, 1, 5]] = 1
    A[1, [1, 0, 2]] = 1
    A[2, [2, 1, 3]] = 1
    A[3, [3, 2, 4, 8]] = 1
    A[4, [4, 3, 9]] = 1
    A[5, [5, 0, 6, 10]] = 1
    A[6, [6, 5, 7, 11, 12]] = 1
    A[7, [7, 6, 8, 12]] = 1
    A[8, [8, 3, 7, 9, 12, 13]] = 1
    A[9, [9, 4, 8, 14]] = 1
    A[10, [10, 5, 15]] = 1
    A[11, [11, 6, 12, 16]] = 1
    A[12, [12, 6, 7, 8, 11, 13, 16, 17, 18]] = 1
    A[13, [13, 8, 12, 14, 18]] = 1
    A[14, [14, 9, 13, 19]] = 1
    A[15, [15, 10, 20]] = 1
    A[16, [16, 11, 12, 17, 21]] = 1
    A[17, [17, 12, 16, 18, 22]] = 1
    A[18, [18, 12, 13, 17, 19, 23]] = 1
    A[19, [19, 14, 18, 24]] = 1
    A[20, [20, 15, 21]] = 1
    A[21, [21, 16, 20, 22]] = 1
    A[22, [22, 17, 21, 23]] = 1
    A[23, [23, 18, 22, 24]] = 1
    A[24, [24, 19, 23]] = 1
    assert (A - A.T).sum() == 0
    A = (A.T / A.sum(axis=1)).T
    
    # Init emission probabilities
    B = np.random.rand(num_states, num_observations)
    B = (B.T / B.sum(axis=1)).T

    # Init initial probabilities
    pi = np.random.rand(num_states)
    pi /= pi.sum()

    return A, B, pi

In [59]:
def init_transition_matrix_with_removed_edges(num_states):

    A = np.zeros((num_states, num_states))
    A[0, [0, 1, 5]] = 1
    A[1, [1, 0, 2]] = 1
    A[2, [2, 1, 3]] = 1
    A[3, [3, 2, 4, 8]] = 1
    A[4, [4, 3, 9]] = 1
    A[5, [5, 0, 6, 10]] = 1
    A[6, [6, 5, 7, 11]] = 1                                 # removed 6-12
    A[7, [7, 6, 8, 12]] = 1
    A[8, [8, 3, 7, 9, 13]] = 1                              # removed 8-12
    A[9, [9, 4, 8, 14]] = 1
    A[10, [10, 5, 15]] = 1
    A[11, [11, 6, 12, 16]] = 1
    A[12, [12, 7, 11, 16, 17, 18]] = 1                      # removed 12-8, 12-13, 12-6
    A[13, [13, 8, 12, 14, 18]] = 1                          # removed 13-12
    A[14, [14, 9, 13, 19]] = 1
    A[15, [15, 10, 20]] = 1
    A[16, [16, 11, 12, 21]] = 1                             # removed 16-17
    A[17, [17, 12, 18, 22]] = 1                             # removed 17-16
    A[18, [18, 12, 13, 17, 23]] = 1                         # removed 18-19
    A[19, [19, 14, 24]] = 1                                 # removed 19-18
    A[20, [20, 15, 21]] = 1
    A[21, [21, 16, 20, 22]] = 1
    A[22, [22, 17, 21, 23]] = 1
    A[23, [23, 18, 22, 24]] = 1
    A[24, [24, 19, 23]] = 1
    assert (A - A.T).sum() == 0
    A = (A.T / A.sum(axis=1)).T

    return A
    

# **Quesion 1: Learn HMM Parameters**

In [66]:
def baum_welch(sequences, iters=200):

    A, B, pi = init_hmm_params(25, 11)
    
    N = A.shape[0]
    O = B.shape[1]
    T = len(sequences[0])

    for i in range(iters):

        A_num = np.zeros((N, N))           # (N, N)
        A_denom = np.zeros((N, 1))         # (N, 1)
        B_num = np.zeros((N, O))           # (N, O)
        B_denom = np.zeros((N, 1))         # (N, 1)
        pi_num = np.zeros(N)          

        for seq_num in tqdm(range(sequences.shape[0]), bar_format='{l_bar}{bar:100}{r_bar}{bar:-10b}'):
            
            sequence = sequences[seq_num]
        
            alpha, constant = forward(A, B, pi, sequence)         # alpha: (N, T)
            beta = backward(A, B, sequence, constant)             # beta: (N, T)

            # xi: (N, N, T-1)
            # compute xi vectorized 
            alpha_t = alpha[:, :-1]
            beta_t = beta[:, 1:]
            B_t = B[:, sequence[1:]]
            numerator = (A[:, :, None] * alpha_t[:, None, :]) * (beta_t * B_t)
            denom = numerator.sum(axis=(0, 1))
            xi = numerator / (denom + 1e-7)

            gamma_temp = alpha * beta                                # gamma_temp: (N, T)
            gamma = gamma_temp / (gamma_temp.sum(axis=0) + 1e-7)     # gamma: (N, T)

            A_num += xi.sum(axis = 2)                                      # A_num: (N, N)
            A_denom += gamma[:, :-1].sum(axis=1).reshape(-1, 1)            # A_denom: (N, 1)

            for o in range(O):
                B_num[:, o] += np.sum(gamma[:, sequence == o], axis=1)
            B_denom += np.sum(gamma, axis=1).reshape(-1, 1)

            pi_num += gamma[:, 0]

        A_new = A_num / (A_denom + 1e-7)
        B_new = B_num / (B_denom + 1e-7)
        pi_new = pi_num / sequences.shape[1]

        print('A change: {}'.format(np.sum(np.abs(A_new - A))))
        print('B change: {}'.format(np.sum(np.abs(B_new - B))))
        print('pi change: {}'.format(np.sum(np.abs(pi_new - pi))))

        A = A_new
        B = B_new
        pi = pi_new


    return A, B, pi

In [67]:
train_data = np.load('train_data.npy')

A, B, pi = baum_welch(train_data, iters=100)
np.save('outputs/1_transition_matrix.npy', A)
np.save('outputs/2_emission_matrix.npy', B)
np.save('outputs/3_initial_dist.npy', pi)


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:07<00:00, 62.94it/s]


A change: 2.2550103586604924
B change: 12.398190422618763
pi change: 0.2347761903047734


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:07<00:00, 65.98it/s]


A change: 1.1759100462348493
B change: 4.243546598369612
pi change: 0.1195047501268317


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 61.01it/s]


A change: 1.1677573206530218
B change: 3.731168659721776
pi change: 0.07831924046533659


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 60.38it/s]


A change: 1.2255767170370437
B change: 3.1216840628266205
pi change: 0.0534164609200033


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:09<00:00, 52.66it/s]


A change: 1.5940132779795464
B change: 3.0990256210017657
pi change: 0.07203085473981917


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.20it/s]


A change: 1.9224624696556027
B change: 3.129084036019176
pi change: 0.08738291192117165


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 60.22it/s]


A change: 1.9458238151692415
B change: 2.8794381207791853
pi change: 0.09452222958940278


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 60.20it/s]


A change: 1.6310429240162811
B change: 2.5281710456849904
pi change: 0.10165923828426


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 59.87it/s]


A change: 1.3773607674759616
B change: 2.1601098769358833
pi change: 0.09857727487739454


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.27it/s]


A change: 1.2449873508152076
B change: 1.8237230407795093
pi change: 0.0780385472972297


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.50it/s]


A change: 1.1712859148230388
B change: 1.529324458227947
pi change: 0.06250629325120252


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:09<00:00, 52.10it/s]


A change: 1.0513063386692607
B change: 1.3038985982375895
pi change: 0.05065596581412336


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.41it/s]


A change: 0.9288762779398603
B change: 1.147117664411614
pi change: 0.04507407477359409


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 59.18it/s]


A change: 0.8715485379167129
B change: 1.0883720533672445
pi change: 0.042047011043967485


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:09<00:00, 51.09it/s]


A change: 0.885897730064102
B change: 1.114813228185785
pi change: 0.03916563593970287


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 56.40it/s]


A change: 0.9375892264248551
B change: 1.1990304928087583
pi change: 0.03929871699705488


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 55.84it/s]


A change: 0.9359414557295109
B change: 1.2599087301084237
pi change: 0.043845798780400735


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 60.85it/s]


A change: 0.8502120524657999
B change: 1.2336437090185763
pi change: 0.045644113324919015


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:09<00:00, 55.07it/s]


A change: 0.7497025201368898
B change: 1.168084509376068
pi change: 0.040301964861253314


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 59.63it/s]


A change: 0.6757156386846342
B change: 1.0981329276067142
pi change: 0.03400316441081461


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 60.15it/s]


A change: 0.6219188121773449
B change: 1.0497269387094887
pi change: 0.02921980454505238


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 61.90it/s]


A change: 0.5689963962802727
B change: 1.01774811105221
pi change: 0.027924674364434614


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 59.41it/s]


A change: 0.5052209254724684
B change: 0.9841455092103605
pi change: 0.025908201466845283


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:10<00:00, 49.74it/s]


A change: 0.4437311950966675
B change: 0.9390041077683374
pi change: 0.026616249152522777


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.88it/s]


A change: 0.4103956718306724
B change: 0.930451848767073
pi change: 0.029636438270104808


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 56.39it/s]


A change: 0.4068782423666024
B change: 0.9353346473077866
pi change: 0.03390169026160471


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.45it/s]


A change: 0.43219552804662387
B change: 0.9287801767297399
pi change: 0.042201391416891235


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 60.82it/s]


A change: 0.47942392495789293
B change: 0.8983946103868137
pi change: 0.048934244682886846


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.97it/s]


A change: 0.5171319552188339
B change: 0.83611981570007
pi change: 0.05216159591336568


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:09<00:00, 54.53it/s]


A change: 0.529735199865508
B change: 0.7748149089855234
pi change: 0.04792898046327054


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.00it/s]


A change: 0.5136793324724934
B change: 0.7212134748600194
pi change: 0.043224579476344865


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.65it/s]


A change: 0.49063003232750035
B change: 0.674211449808956
pi change: 0.036829844407047


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.33it/s]


A change: 0.46645196363709196
B change: 0.6398088743458245
pi change: 0.030987368962309664


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.01it/s]


A change: 0.4419864720665632
B change: 0.6207515218481293
pi change: 0.02713379406117323


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.63it/s]


A change: 0.42020844692855297
B change: 0.6047999214614392
pi change: 0.024456551950308672


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.38it/s]


A change: 0.40827822082129556
B change: 0.589601884888266
pi change: 0.022203315867756365


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 60.44it/s]


A change: 0.40721430249457136
B change: 0.5800126152119622
pi change: 0.02026889023037487


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:10<00:00, 48.39it/s]


A change: 0.4146995283585889
B change: 0.5697276838108098
pi change: 0.018656072459094165


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.31it/s]


A change: 0.42908503497579037
B change: 0.5567501056323478
pi change: 0.018360897709177725


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.30it/s]


A change: 0.4389652134896721
B change: 0.5376923351382783
pi change: 0.01860316407419247


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.60it/s]


A change: 0.4372302181784862
B change: 0.5096985347427307
pi change: 0.019231906663193805


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.45it/s]


A change: 0.41872968961236556
B change: 0.4711704286202295
pi change: 0.01948057952225579


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.07it/s]


A change: 0.3849032415914576
B change: 0.42188934900079816
pi change: 0.019041727817412833


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.37it/s]


A change: 0.33867262960793026
B change: 0.36360387996070187
pi change: 0.01773388078004008


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.55it/s]


A change: 0.2891600088542077
B change: 0.3040196427573182
pi change: 0.0158520330529136


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.98it/s]


A change: 0.24278146384396537
B change: 0.2528197763234843
pi change: 0.013837793193016553


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 56.78it/s]


A change: 0.20524210168499135
B change: 0.22095344711764636
pi change: 0.011950058389823163


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 59.29it/s]


A change: 0.1750237103133078
B change: 0.19655321602440734
pi change: 0.010282350171604277


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 56.98it/s]


A change: 0.15014876854077863
B change: 0.17369815855376797
pi change: 0.008779257803702319


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.57it/s]


A change: 0.12944278091430536
B change: 0.15285409718424464
pi change: 0.007502274729946077


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.01it/s]


A change: 0.11343618290122179
B change: 0.13426521395355445
pi change: 0.006513041002459613


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.61it/s]


A change: 0.10079814565023015
B change: 0.11794813299839112
pi change: 0.005649822918322948


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 56.83it/s]


A change: 0.09180434938798435
B change: 0.10412085389537568
pi change: 0.004874564109257027


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 60.05it/s]


A change: 0.0849912775644655
B change: 0.09283905887926189
pi change: 0.004225927438135969


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.37it/s]


A change: 0.07982687254655277
B change: 0.08350466022473442
pi change: 0.0037041646026122516


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.16it/s]


A change: 0.07589804917992657
B change: 0.07580812685219673
pi change: 0.003313106098642313


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 56.79it/s]


A change: 0.07274988274108879
B change: 0.06950552263606782
pi change: 0.0029706194662994616


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.02it/s]


A change: 0.07020658519927399
B change: 0.06437119090138059
pi change: 0.0026767009927937727


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.84it/s]


A change: 0.06821303715500648
B change: 0.060402274164393796
pi change: 0.0024296547261136434


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:09<00:00, 55.17it/s]


A change: 0.06675422847169997
B change: 0.05735512588577968
pi change: 0.002225726881051151


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.91it/s]


A change: 0.06577320192369208
B change: 0.055223294798903276
pi change: 0.0020636374472187643


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.36it/s]


A change: 0.06524177432687225
B change: 0.053891205561232995
pi change: 0.0019581294165576138


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 59.19it/s]


A change: 0.06519314467488581
B change: 0.05317008603600713
pi change: 0.0018845908300505467


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.20it/s]


A change: 0.065615295970923
B change: 0.052999372094914204
pi change: 0.001838646979983937


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 60.07it/s]


A change: 0.06668074997334376
B change: 0.05330694355842593
pi change: 0.001812337647583501


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.21it/s]


A change: 0.06834535460568493
B change: 0.053854633970363906
pi change: 0.0018107250421342952


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.60it/s]


A change: 0.07044477650539409
B change: 0.054661148335562446
pi change: 0.0018209217688831404


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.20it/s]


A change: 0.07269414548117799
B change: 0.05580983357366894
pi change: 0.001838415891510542


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 59.49it/s]


A change: 0.07491615236630943
B change: 0.05741435936313251
pi change: 0.0018622060899791074


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.55it/s]


A change: 0.0772927250825043
B change: 0.05921761326313756
pi change: 0.0018949249718026033


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:10<00:00, 47.25it/s]


A change: 0.07996238136256695
B change: 0.06123561106424612
pi change: 0.0019461500029039124


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.19it/s]


A change: 0.0829767449402021
B change: 0.06351767289681924
pi change: 0.002004982641053558


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 59.69it/s]


A change: 0.08648417696707608
B change: 0.06603663763282118
pi change: 0.002073667470841455


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.40it/s]


A change: 0.09044917494014694
B change: 0.06878185032993606
pi change: 0.0021521377876690213


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.34it/s]


A change: 0.09469185386433887
B change: 0.07173548628576815
pi change: 0.0022518247987749467


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.23it/s]


A change: 0.0991261026995214
B change: 0.07500948619280778
pi change: 0.002389814119566316


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.30it/s]


A change: 0.10367037787615346
B change: 0.078667564932443
pi change: 0.002540090904808957


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.86it/s]


A change: 0.10832478065717432
B change: 0.08265057853768629
pi change: 0.00271920568944213


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 56.85it/s]


A change: 0.11299262060361519
B change: 0.08687139047921125
pi change: 0.0029233305426556618


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 61.27it/s]


A change: 0.11748669661840552
B change: 0.09130565615339041
pi change: 0.0031410892717938298


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.67it/s]


A change: 0.12200955904358197
B change: 0.09600628849245627
pi change: 0.0033705870341809606


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.15it/s]


A change: 0.126182230003119
B change: 0.10091492386140122
pi change: 0.0036086476165258547


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 59.89it/s]


A change: 0.13032575969674748
B change: 0.10609798231357767
pi change: 0.003850425717435638


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.40it/s]


A change: 0.13432248884645365
B change: 0.11129992874530711
pi change: 0.004088954036541548


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.00it/s]


A change: 0.13799295816284307
B change: 0.11621622872545681
pi change: 0.004338683023863161


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 60.04it/s]


A change: 0.14079013361632303
B change: 0.12041094939495746
pi change: 0.004573006833126787


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 59.38it/s]


A change: 0.1424769254949271
B change: 0.123581084411664
pi change: 0.0047758458825495845


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.72it/s]


A change: 0.14297730533613062
B change: 0.12668639464929596
pi change: 0.0049363449402371265


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.08it/s]


A change: 0.14254554320063254
B change: 0.12900496265311934
pi change: 0.005049797830150191


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.90it/s]


A change: 0.14108732471112578
B change: 0.1303490972063257
pi change: 0.005131361167384045


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.24it/s]


A change: 0.1387124506170082
B change: 0.1306874968447609
pi change: 0.005161324210263916


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.96it/s]


A change: 0.1356361585992318
B change: 0.13111300561774222
pi change: 0.00512761452697753


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.47it/s]


A change: 0.1321057496128168
B change: 0.1323243026123758
pi change: 0.0050320551223868425


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.77it/s]


A change: 0.12840198660958618
B change: 0.13400696847253374
pi change: 0.00490780992113553


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.08it/s]


A change: 0.12486489833662262
B change: 0.13528035693257906
pi change: 0.00476653909388576


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 61.83it/s]


A change: 0.12151622271379778
B change: 0.1364523603819029
pi change: 0.004589433322444852


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 59.17it/s]


A change: 0.11915296738540071
B change: 0.1374695233612846
pi change: 0.004387000153360996


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 58.64it/s]


A change: 0.11700238194520873
B change: 0.13840470539653443
pi change: 0.004169702497883585


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 57.66it/s]


A change: 0.11495373972692627
B change: 0.1396925130968785
pi change: 0.003956935478581745


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:08<00:00, 59.84it/s]

A change: 0.11274278613089578
B change: 0.14135961750496723
pi change: 0.0037903820547274775





# **Quesion 2: Compute sequence probabilities**

In [68]:
def forward_backward(sequence, A, B, pi):
    T = len(sequence)
    idx = np.random.randint(1, T)
    alpha, c = forward(A, B, pi, sequence, eval=True)
    beta = backward(A, B, sequence, c, eval=True)
    prob = alpha[:, idx] @ beta[:, idx]
    return prob

test_data = np.load('test_data.npy')
test_probs = np.zeros(test_data.shape[0])
for i, observation in enumerate(test_data):
    prob = forward_backward(observation, A, B, pi)
    test_probs[i] = prob
np.save('outputs/4_evaluation_problem.npy', test_probs)

# **Quesion 3: Most probable state sequence**

In [69]:
def viterbi(sequence, A, B, pi):
    T = len(sequence)
    N = A.shape[0]
    delta = np.zeros((N, T))
    backtrack = np.zeros((N, T), dtype=np.int32)
    delta[:, 0] = np.log(pi) + np.log(B[:, sequence[0]])
    backtrack[:, 0] = 0
    for i in range(1, T):
        temp = (np.log(A) + delta[:, i-1].reshape(-1, 1)) + np.log(B[:, sequence[i]])
        delta[:, i] = np.max(temp, axis=0)
        backtrack[:, i] = np.argmax(temp, axis=0)
    current_state = np.argmax(delta[:, -1])
    state_seq = [current_state]
    total_prob = np.exp(delta[current_state, -1])
    for t in range(1, T)[::-1]:
        prev_state = backtrack[current_state, t]
        state_seq.append(prev_state)
        current_state = prev_state
    return total_prob, state_seq[::-1]



In [70]:
A = np.load('outputs/1_transition_matrix.npy')
B = np.load('outputs/2_emission_matrix.npy')
pi = np.load('outputs/3_initial_dist.npy')
test_data = np.load('test_data.npy')

test_state_sequences = np.zeros_like(test_data)
for i, observation in enumerate(test_data):
    prob, state_seq = viterbi(observation, A, B, pi)
    test_state_sequences[i, :] = state_seq
np.save('outputs/5_best_paths.npy', test_state_sequences)

  if __name__ == '__main__':


# **Quesion 4**

In [71]:
P = np.load('outputs/1_transition_matrix.npy')
Q = init_transition_matrix_with_removed_edges(25)
new_P = np.zeros((25, 25))

a, b = np.linalg.eig(P.T)
c = b[:, a.argmax()]
target_steady = np.real(c / c.sum())
# print(target_steady)

current_state = np.random.randint(0, 25)

L = 1000000
state_probs = np.zeros((25, ))
state_probs[current_state] += 1

for _ in range(L):
    next_state = rnd.choices(range(0, 25), weights=Q[current_state, :])[0]
    aij = min(1, (target_steady[next_state] * Q[next_state, current_state])/(target_steady[current_state] * Q[current_state, next_state] + 1e-10))
    if rnd.uniform(0, 1) < aij:
        new_P[current_state, next_state] += 1
        current_state = next_state
    else:
        new_P[current_state, current_state] += 1
        current_state = current_state
    state_probs[current_state] += 1

state_probs = state_probs / L
new_P = new_P / new_P.sum(axis=1)[:, None]

new_steady = np.linalg.matrix_power(new_P, 2000)[0, :]
np.save('outputs/6_transition_after_edge_removal.npy', new_P)
print(np.abs(new_steady - target_steady))

[8.30689115e-04 1.69093041e-05 2.15146269e-04 2.71379171e-04
 2.30843830e-04 7.49435658e-04 8.51770621e-05 5.91516624e-05
 1.99656843e-04 6.70877435e-05 2.63421444e-04 1.11450880e-04
 6.97044198e-05 3.32440353e-04 3.40239926e-05 6.47014845e-04
 1.69547126e-04 5.22508701e-04 2.64834854e-04 2.16257265e-05
 7.95967952e-04 8.62717567e-05 7.56529870e-04 3.95687578e-04
 4.80744045e-05]
