# Simulación Cadenas de Markov

### Ejemplo 1

Una empresa esta considerando utilizar Cadenas de Markov para analizar los cambios en las preferencias de los usuarios por tres marcas distintas de un determinado producto. El estudio ha arrojado la siguiente estimación de la matriz de probabilidades de cambiarse de una marca a otra cada mes:

| 0  | 1    | 2    | 3    |
|---|------|------|------| 
| 1 | 0.80 | 0.10 | 0.10 |
| 2 | 0.03 | 0.95 | 0.02 |
| 3 | 0.20 | 0.05 | 0.75 |

Si en la actualidad la participación de mercado es de 45%, 25% y 30%, respectivamente. 

¿Cuales serán las participaciones de mercado de cada marca en dos meses más?.

In [1]:
# bibliotecas
import numpy        as np  # Funciones vectoriales
import scipy.linalg as la  # Funciones de algebra lineal

In [2]:
# Generamos nuestras variables
distribucion_inicial = np.matrix( np.array([0.45, 0.25, 0.30]) )
matriz_transicion    = np.matrix( np.array([[0.80,0.10,0.10],[0.03,0.95,0.02],[0.20,0.05,0.75]],dtype=np.float64) )
print("Distribución Inicial < Dimensiones =", distribucion_inicial.shape , ">" )
print(distribucion_inicial)

print("")
print("Matriz de Transición < Dimensiones =", matriz_transicion.shape , ">" )
print(matriz_transicion)

Distribución Inicial < Dimensiones = (1, 3) >
[[0.45 0.25 0.3 ]]

Matriz de Transición < Dimensiones = (3, 3) >
[[0.8  0.1  0.1 ]
 [0.03 0.95 0.02]
 [0.2  0.05 0.75]]


In [3]:
# Una forma de tener la distribucion estacional es unicamente ir multiplicando
# la distribucion inicial por la matriz de transicion
paso_n = 13
distribucion_estacional = distribucion_inicial
for sim in range(paso_n-1):
    distribucion_estacional = distribucion_estacional * matriz_transicion
    #print("Sim :: ", sim,  np.round( distribucion_estacional, 5 ) )
    #print(np.sum(distribucion_estacional))
    
print("Distribución en el paso n =", paso_n - 1, "es",  np.round( distribucion_estacional, 5 ) )

Distribución en el paso n = 12 es [[0.28043 0.55006 0.16951]]


### Ejemplo 2

Supongamos que introducimos un ratón de forma aleatoria en una de las celdas de dicho laberinto.

![Laberinto](laberinto.JPG)

Sea $X_n$ = celda ocupada en el minuto $n$

Además, supongamos que la probabilidad inicial de empezar en cualquier celda es la misma.

Tenemos que la matriz de transición T como la siguiente

![Matriz de Transición](matriz_transicion.JPG)

Se desea averiguar cual es la probabilidad de que dejando pasar muchos minutos, el ratón se encuentre en cada una de las celdas.

In [4]:
# Creamos nuestra variable con la probabilidad inicial
distribucion_inicial = np.matrix( np.array( [1/6,1/6,1/6,1/6,1/6,1/6]))
matriz_transicion    = np.matrix( np.array([[1/3, 1/3, 0, 1/3, 0, 0],
                                           [1/2, 1/2, 0, 0, 0, 0],
                                           [0, 0, 1/2, 0, 0, 1/2],
                                           [1/2, 0, 0, 1/2, 0, 0],
                                           [0, 0, 0, 0, 1/2, 1/2],
                                           [0, 0, 1/3, 0, 1/3, 1/3]] ) )

print("Distribución Inicial:")
print( np.round( distribucion_inicial, 4 ) )
print("")
print("Matriz de transición:")
print( np.round( matriz_transicion, 4 ) )

Distribución Inicial:
[[0.1667 0.1667 0.1667 0.1667 0.1667 0.1667]]

Matriz de transición:
[[0.3333 0.3333 0.     0.3333 0.     0.    ]
 [0.5    0.5    0.     0.     0.     0.    ]
 [0.     0.     0.5    0.     0.     0.5   ]
 [0.5    0.     0.     0.5    0.     0.    ]
 [0.     0.     0.     0.     0.5    0.5   ]
 [0.     0.     0.3333 0.     0.3333 0.3333]]


In [5]:
# Descomposicion de la matriz de Transición T = C * A * C^-1
A, C = la.eig( matriz_transicion )        # Realizamos la descomposición
A    = np.matrix(np.diag(A)).real         # La transformamos a una matriz cuadrada
C    = np.matrix(C)                       # La transformamos a una matriz cuadrada
matriz_verificacion = C * A * la.inv(C)   # Realizamos la multiplicación para verificación
print("Matriz de Verificación")
print( np.round( matriz_verificacion, 4)  )
print("")
print("Verificación Entrada por entrada")
print( np.abs( matriz_verificacion - matriz_transicion ) < 1E-15 ) 


Matriz de Verificación
[[ 0.3333  0.3333  0.      0.3333  0.      0.    ]
 [ 0.5     0.5     0.     -0.      0.      0.    ]
 [ 0.      0.      0.5     0.     -0.      0.5   ]
 [ 0.5    -0.      0.      0.5     0.      0.    ]
 [ 0.      0.     -0.      0.      0.5     0.5   ]
 [ 0.      0.      0.3333  0.      0.3333  0.3333]]

Verificación Entrada por entrada
[[ True  True  True  True  True  True]
 [ True  True  True  True  True  True]
 [ True  True  True  True  True  True]
 [ True  True  True  True  True  True]
 [ True  True  True  True  True  True]
 [ True  True  True  True  True  True]]


In [6]:
n = 20
matriz_trans_paso_n = C * A** n * la.inv(C)
distribucion_paso_n = distribucion_inicial * matriz_trans_paso_n

print("Distribución en el paso n:")
print( np.round( distribucion_paso_n, 4 ) )
print("")
print("Matriz de transicion en el paso n:")
print( np.round( matriz_trans_paso_n, 4) )

Distribución en el paso n:
[[0.2143 0.1429 0.1429 0.1429 0.1429 0.2143]]

Matriz de transicion en el paso n:
[[0.4286 0.2857 0.     0.2857 0.     0.    ]
 [0.4286 0.2857 0.     0.2857 0.     0.    ]
 [0.     0.     0.2857 0.     0.2857 0.4286]
 [0.4286 0.2857 0.     0.2857 0.     0.    ]
 [0.     0.     0.2857 0.     0.2857 0.4286]
 [0.     0.     0.2857 0.     0.2857 0.4286]]


In [7]:
# Super método infalibre para encontrar la distribución estacionaria sin tanteo 
tolerancia   = 1E-10           # tolerancia/diferencias que permitimos que cambie entre un paso y otro
diferencias  = 1               # variable que me indica la diferencia entre un paso y otro
iter_maximas = 100             # numero de iteraciones maximas que le permitimos al algoritmo en caso de no converguer
iteracion    = 0               # variable que me indica la cantidad de iteraciones que lleva el algoritmo

# Inicio del algoritmo
distribucion_estacionaria = distribucion_inicial
while np.all( diferencias > tolerancia ) and iteracion <= iter_maximas:
    iteracion   = iteracion + 1
    diferencias = np.abs( distribucion_estacionaria * matriz_transicion -  distribucion_estacionaria )
    distribucion_estacionaria = distribucion_estacionaria * matriz_transicion 
    print("Iteración :: ", iteracion)
    #print( np.round(diferencias,7) )

print("")
print("Distribución Estacionaria: ", np.round( distribucion_estacionaria,4 ) )
print("La Distribución Estacionaria se alcanza en el paso N = ", iteracion  )

Iteración ::  1
Iteración ::  2
Iteración ::  3
Iteración ::  4
Iteración ::  5
Iteración ::  6
Iteración ::  7
Iteración ::  8
Iteración ::  9
Iteración ::  10
Iteración ::  11
Iteración ::  12

Distribución Estacionaria:  [[0.2143 0.1429 0.1429 0.1429 0.1429 0.2143]]
La Distribución Estacionaria se alcanza en el paso N =  12


Ahora imaginemos que existe una celda número 7 (estado = 7) que es la salida del laberinto, y que al salir del laberinto, el ratón ya no regresa al mismo.

Entonces, podemos pensar que el estado = 7 es un estado absorbente.

La pregunta natural que nos podemos hacer es, ¿Cuántos minutos en promedio tardará el ratón en salir del laberinto?

In [8]:
# Creamos nuestra variable con la probabilidad inicial
distribucion_inicial = np.matrix( np.array( [1/6,1/6,1/6,1/6,1/6,1/6, 0]))
matriz_transicion    = np.matrix( np.array([[1/3, 1/3, 0, 1/3, 0, 0,0],
                                           [1/2, 1/2, 0, 0, 0, 0,0],
                                           [0, 0, 1/2, 0, 0, 1/2,0],
                                           [1/2, 0, 0, 1/2, 0, 0,0],
                                           [0, 0, 0, 0, 1/3, 1/3,1/3],
                                           [0, 0, 1/3, 0, 1/3, 1/3,0],
                                           [0, 0, 0, 0, 0, 0, 1]] ) )

print("Distribución Inicial:")
print( np.round( distribucion_inicial, 4 ) )
print("")
print("Matriz de transición:")
print( np.round( matriz_transicion, 4 ) )


Distribución Inicial:
[[0.1667 0.1667 0.1667 0.1667 0.1667 0.1667 0.    ]]

Matriz de transición:
[[0.3333 0.3333 0.     0.3333 0.     0.     0.    ]
 [0.5    0.5    0.     0.     0.     0.     0.    ]
 [0.     0.     0.5    0.     0.     0.5    0.    ]
 [0.5    0.     0.     0.5    0.     0.     0.    ]
 [0.     0.     0.     0.     0.3333 0.3333 0.3333]
 [0.     0.     0.3333 0.     0.3333 0.3333 0.    ]
 [0.     0.     0.     0.     0.     0.     1.    ]]


In [9]:
# Descomposicion de la matriz de Transición T = C * A * C^-1
A, C = la.eig( matriz_transicion )        # Realizamos la descomposición
A    = np.matrix(np.diag(A)).real         # La transformamos a una matriz cuadrada
C    = np.matrix(C)                       # La transformamos a una matriz cuadrada
matriz_verificacion = C * A * la.inv(C)   # Realizamos la multiplicación para verificación
print("Matriz de Verificación")
print( np.round( matriz_verificacion, 4)  )
print("")
print("Verificación Entrada por entrada")
print( np.abs( matriz_verificacion - matriz_transicion ) < 1E-15 ) 

Matriz de Verificación
[[ 0.3333  0.3333  0.      0.3333  0.      0.      0.    ]
 [ 0.5     0.5     0.     -0.      0.      0.      0.    ]
 [ 0.      0.      0.5     0.     -0.      0.5     0.    ]
 [ 0.5    -0.      0.      0.5     0.      0.      0.    ]
 [ 0.      0.     -0.      0.      0.3333  0.3333  0.3333]
 [ 0.      0.      0.3333  0.      0.3333  0.3333  0.    ]
 [ 0.      0.      0.      0.      0.      0.      1.    ]]

Verificación Entrada por entrada
[[ True  True  True  True  True  True  True]
 [ True  True  True  True  True  True  True]
 [ True  True  True  True  True  True  True]
 [ True  True  True  True  True  True  True]
 [ True  True  True  True  True  True  True]
 [ True  True  True  True  True  True  True]
 [ True  True  True  True  True  True  True]]


In [10]:
n = 1000
matriz_trans_paso_n = C * A** n * la.inv(C)
distribucion_paso_n = distribucion_inicial * matriz_trans_paso_n

print("Distribución en el paso n:")
print( np.round( distribucion_paso_n, 4 ) )
print("")
print("Matriz de transicion en el paso n:")
print( np.round( matriz_trans_paso_n, 1) )

Distribución en el paso n:
[[0.2143 0.1429 0.     0.1429 0.     0.     0.5   ]]

Matriz de transicion en el paso n:
[[0.4 0.3 0.  0.3 0.  0.  0. ]
 [0.4 0.3 0.  0.3 0.  0.  0. ]
 [0.  0.  0.  0.  0.  0.  1. ]
 [0.4 0.3 0.  0.3 0.  0.  0. ]
 [0.  0.  0.  0.  0.  0.  1. ]
 [0.  0.  0.  0.  0.  0.  1. ]
 [0.  0.  0.  0.  0.  0.  1. ]]


In [11]:
# Super método infalibre para encontrar la distribución estacionaria sin tanteo 
tolerancia   = 1E-10           # tolerancia/diferencias que permitimos que cambie entre un paso y otro
diferencias  = 1               # variable que me indica la diferencia entre un paso y otro
iter_maximas = 100             # numero de iteraciones maximas que le permitimos al algoritmo en caso de no converguer
iteracion    = 0               # variable que me indica la cantidad de iteraciones que lleva el algoritmo

# Inicio del algoritmo
distribucion_estacionaria = distribucion_inicial
while np.all( diferencias > tolerancia ) and iteracion <= iter_maximas:
    iteracion   = iteracion + 1
    diferencias = np.abs( distribucion_estacionaria * matriz_transicion -  distribucion_estacionaria )
    distribucion_estacionaria = distribucion_estacionaria * matriz_transicion 
    print("Iteración :: ", iteracion)
    #print( np.round(diferencias,7) )

print("")
print("Distribución Estacionaria: ", np.round( distribucion_estacionaria,4 ) )
print("La Distribución Estacionaria se alcanza en el paso N = ", iteracion  )

Iteración ::  1
Iteración ::  2
Iteración ::  3
Iteración ::  4
Iteración ::  5
Iteración ::  6
Iteración ::  7
Iteración ::  8
Iteración ::  9
Iteración ::  10
Iteración ::  11
Iteración ::  12

Distribución Estacionaria:  [[0.2143 0.1429 0.059  0.1429 0.0423 0.0743 0.3244]]
La Distribución Estacionaria se alcanza en el paso N =  12
