# Práctica de modelos ocultos de Markov
## Ampliación de Inteligencia Artificial 
### Dpto. de C. de la Computación e I.A. (Univ. de Sevilla)

 ## Parte I: Cadenas de Markov


### Ejercicio 1.1
 
 Definir en primer lugar la clase MC para la representación en Python de una
 cadena de Markov.

 La clase ha de constar de los siguientes atributos:

 Atributos:
 * estados: Una lista con los estados que definen la variable oculta del modelo.
             [s_1, ..., s_n]
 * pi: Un diccionario, cuyas claves son los estados, y cuyos valores son las probabilidades iniciales:
             pi[s_i] = P(X_1 = s_i)
 * a: Un diccionario cuyas claves son parejas (tuplas) de estados y cuyos valores son las correspondientes probabilidades de la matriz de transición:
             a[(s_i, s_j)] = P(X_t = s_j | X_{t-1} = s_i)

 El constructor de la clase recibe una lista con los estados, otra con las
 probabilidades de inicio y una lista de listas representando la matriz de
 probabilidades de transición (es decir, en la fila i, columna j, se encuentra
 la probabilidad de pasar de s_i a s_j). )


 Ejemplo (ver diapositiva 8):

```
 >>> ej1_mc=MC(["calor","frío","lluvia"],
              [0.5,0.3,0.2],
             [[0.5,0.2,0.3],
               [0.2,0.5,0.3],
              [0.3,0.1,0.6]])

 >>> ej1_mc.estados
 ['calor', 'frío', 'lluvia']

 >>> ej1_mc.a
 
{('calor', 'calor'): 0.5,
 ('calor', 'frío'): 0.2,
 ('calor', 'lluvia'): 0.3,
 ('frío', 'calor'): 0.2,
 ('frío', 'frío'): 0.5,
 ('frío', 'lluvia'): 0.3,
 ('lluvia', 'calor'): 0.3,
 ('lluvia', 'frío'): 0.1,
 ('lluvia', 'lluvia'): 0.6}

 >>> ej1_mc.pi
 {'calor': 0.5, 'frío': 0.3, 'lluvia': 0.2}
```

In [3]:
class MC():
    
    def __init__(self, estados, mat_ini, mat_trans):
        self.estados = estados
        self.pi =dict(zip(estados, mat_ini))
        self.a={(si, sj):p for (si,l) in zip(estados,mat_trans)
                for (sj, p) in zip(estados, l)}

ej1_mc=MC(["calor", "calor", "lluvia"], )

### Ejercicio 1.2


Definir una función "prob_secuencia(mc,secuencia)", que dado una cadena de
Markov (definida como en el apartado anterior), y una secuencia de estados,
calcula la probabilidad de que ocurra dicha secuencia:

Por ejemplo:

```
>>> prob_secuencia(ej1_mc,["calor","calor","lluvia","frío"])
0.0075
>>> prob_secuencia(ej1_mc,["calor"]*7)
0.0078125
>>> prob_secuencia(ej1_mc,["frío"]*5+["lluvia"]*3)
0.002025
```

### Ejercicio 1.3

Definir una función:

```
    todas_las_secuencias(mc,e,t)
```
que dada una cadena de Markov mc, un estado e y un instante t, genere 
todas las secuencias posibles de t estados que acaban en e. 
Indicación: puede ser útil usar la función "product" del módulo  itertools    
    
Ejemplo:

```
>>> todas_las_secuencias(ej1_mc,"frío",4)

[['calor', 'calor', 'calor', 'frío'],
['calor', 'calor', 'frío', 'frío'],
['calor', 'calor', 'lluvia', 'frío'],
['calor', 'frío', 'calor', 'frío'],
['calor', 'frío', 'frío', 'frío'],
['calor', 'frío', 'lluvia', 'frío'],
['calor', 'lluvia', 'calor', 'frío'],
['calor', 'lluvia', 'frío', 'frío'],
['calor', 'lluvia', 'lluvia', 'frío'],
['frío', 'calor', 'calor', 'frío'],
['frío', 'calor', 'frío', 'frío'],
['frío', 'calor', 'lluvia', 'frío'],
['frío', 'frío', 'calor', 'frío'],
['frío', 'frío', 'frío', 'frío'],
['frío', 'frío', 'lluvia', 'frío'],
['frío', 'lluvia', 'calor', 'frío'],
['frío', 'lluvia', 'frío', 'frío'],
['frío', 'lluvia', 'lluvia', 'frío'],
['lluvia', 'calor', 'calor', 'frío'],
['lluvia', 'calor', 'frío', 'frío'],
['lluvia', 'calor', 'lluvia', 'frío'],
['lluvia', 'frío', 'calor', 'frío'],
['lluvia', 'frío', 'frío', 'frío'],
['lluvia', 'frío', 'lluvia', 'frío'],
['lluvia', 'lluvia', 'calor', 'frío'],
['lluvia', 'lluvia', 'frío', 'frío'],
['lluvia', 'lluvia', 'lluvia', 'frío']]
```

### Ejercicio 1.4

Definir una función "prob_estado(mc, estado, t)" que recibiendo una cadena de Markov, 
un estado, y un instante t, calcula la probabilidad de que en el instante t
el sistema se encuentre en ese estado.     
    
Implementar dos versiones, tal y como se explica en la diapositiva 13:
una "lenta" que suma las probabilidades de todas las secuencias de longitud t que 
acaban en el estado, y otra "rápida" que hace el cáculo recursivamente.     
    
Comparar el rendimiento de ambas versiones.    

Ejemplo:
    
```
>>> prob_estado(ej1_mc,"calor",3)
0.347
>>> prob_estado(ej1_mc,"lluvia",20)
0.4285714285448624
```

## Parte 2: Representación: modelos ocultos de Markov

### Ejercicio 2.1


Definir en la clase HMM para la representación en
Python de los modelos ocultos de Markov.

La clase ha de constar de los siguientes atributos:

Atributos:
 - estados: Una lista con los estados que definen la variable ocultadel modelo.
                [s_1, ..., s_n]
 - observables: Una lista con las observaciones que definen la variable observable del modelo.
                [v_1, ..., v_m]
 - pi: Un diccionario, cuyas claves son los estados, y cuyos valores son las probabilidades iniciales:
                pi[s_i] = P(X_1 = s_i)
 - a: Un diccionario cuyas claves son parejas (tuplas) de estados y cuyos valores son las correspondientes probabilidades de la  matriz de transición:
                a[(s_i, s_j)] = P(X_t = s_j | X_{t-1} = s_i)
 - b: Un diccionario cuyas claves son parejas (tuplas) de estado y observación, y cuyos valores son las correspondientes probabilidades de la matriz de observaciones:
                b[(s_i,v_j)] = P(E_t = v_j | X_{t} = s_i)

El constructor de la clase ha de recibir los siguientes datos:

 -  Una lista con los estados de la variable oculta.
              [s_1, ..., s_n]
 - Una lista con las correspondiente probabilidades a priori
              [P(X_1 = s_1), ..., P(X_1 = s_n)]
 - Una lista de listas representando la matriz de transición
              [
               [P(X_t = s_1 | X_{t-1} = s_1), ..., P(X_t = s_n | X_{t-1} = s_1)], 
               ... 
               ... 
               ... 
               [P(X_t = s_1 | X_{t-1} = s_n), ..., P(X_t = s_n | X_{t-1} = s_n)]
              ]
               
 - Una lista con los estados de la variable observable.
              [v_1, ..., v_m]
 - Un lista de listas representando la matriz de observación
              [
               [P(E_t = v_1 | X_t = s_1), ..., P(E_t = v_m | X_t = s_1)], 
               ... 
               ... 
               ... 
               [P(E_t = v_1 | X_t = s_n), ..., P(E_t = v_m | X_t = s_n)]
              ]


In [5]:
class HMM():
    
    def __init__(self, estados, mat_ini, mat_trans, observables, mat_obs):
        self.estados = estados
        self.pi =dict(zip(estados, mat_ini))
        self.a={(si, sj):p for (si,l) in zip(estados,mat_trans)
                for (sj, p) in zip(estados, l)}
        self.observables=observables
        self.b={(si,vj):p for (si,l) in zip(estados,mat_obs)
                for (vj, p) in zip(observables, l)}

In [8]:
ej1_hmm = HMM(["c", "f"],
[0.8,0.2],
[[0.7,0.3],[0.4,0.6]],
[1,2,3],
[[0.2,0.4,0.4],[0.5,0.4,0.1]])

ej2_hmm = HMM(["l", "no l"],
[0.5,0.5],
[[0.7,0.3],[0.3,0.7]],
["u", "no u"],
[[0.9,0.1], [0.2,0.8]])

In [9]:
ej1_hmm.b

{('c', 1): 0.2,
 ('c', 2): 0.4,
 ('c', 3): 0.4,
 ('f', 1): 0.5,
 ('f', 2): 0.4,
 ('f', 3): 0.1}

## Ejercicio 2.2

Comprobar a partir de los dos ejemplos de modelo oculto de Markov
vistos en teoría la correcta definición de la clase anterior.


In [22]:
ej1_hmm.b

## Parte 3: Muestreo en modelos ocultos de Markov


### Ejercicio 3.1


Se pide ahora definir un algoritmo de muestreo para modelos ocultos de
Markov. Es decir una función:

```
        muestreo_hmm(hmm,n)
```

que recibiendo un modelo oculto de Markov y un número natural n, genera una 
secuencia de n estados y la correspondiente secuencia de n observaciones, 
siguiendo las probabilidades del modelo. 

Explicamos a continuación con más detalle este algoritmo de muestreo,
ilustrándolo con un ejemplo, suponiendo que el modelo oculto de Markov es el
primer ejemplo que se usa en las diapositivas (el de los helados).

  El problema es generar una secuencia de estados, con las correspondientes
observaciones, siguiendo las probabilidades del modelo. Supondremos que
disponemos de un generador de números aleatorios entre 0 y 1, con
probabilidad uniforme (es decir, el random de python). Vamos a generar una
secuencia de 3 estados y la correspondiente secuencia de 3 observaciones.

  El primer estado ha de ser generado siguiendo el vector de probabilidades
iniciales. En este caso pi_1=P(c)=0.8 y pi_2=P(f)=0.2. Supongamos que
al generar un número aleatorio, obtenemos 0.65. Esto significa que el
primer estado en nuestra secuencia es c.

  Ahora tenemos que generar la observación correspondiente, y para ello
usamos las probabilidades de la matriz de observaciones. Puesto que el estado
actual es c, las probabilidades de generar cada observable son: b_1(1) =
P(1|c) = 0.2, b_1(2) = P(2|c) = 0.4 y b_1(3) = P(3|c) = 0.4. Si
obtenemos aleatoriamente el número 0.53, eso significa que la observación
correspondiente es 2, ya que es la primera de las observaciones cuya
probabilidad acumulada (0.2+0.4) supera a 0.53.

  Generamos ahora el siguiente estado. Para ello usamos las probabilidades
de la matriz de transición. Como el estado actual es c, las probabilidades de
que cada estado sea generado a continuación son: a_11 = P(c|c) = 0.7 y
a_12 = P(f|c) = 0.3. Si aleatoriamente obtenemos el número 0.82,
significa que hemos obtenido f como siguiente estado.

  Para la siguientes observaciones y estados, procedemos de la misma
manera. Por ejemplo, si el siguiente número aleatorio que obtenemos es
0.29, la observación correspondiente es 1. Si a continuación obtenemos
los números aleatorios 0.41 y 0.12, el estado siguiente es f y la
observación sería 1. En resumen, hemos generado la secuencia de estados
[c,f,f] con la correspondiente secuencia de observaciones [2,1,1].

Ejemplos (téngase en cuenta que la salida está sujeta a aleatoriedad):

```
>>> muestreo_hmm(ej1_hmm,10)  
[['c', 'c', 'f', 'f', 'c', 'c', 'c', 'c', 'c', 'c'],
 [2, 1, 1, 1, 3, 2, 1, 2, 3, 1]]

>>> muestreo_hmm(ej1_hmm,10) 
[['c', 'c', 'f', 'f', 'f', 'f', 'c', 'c', 'c', 'c'],
 [1, 1, 1, 1, 3, 1, 2, 3, 2, 3]]


>>> muestreo_hmm(ej2_hmm,7)
[['l', 'l', 'l', 'l', 'no l', 'l', 'l'],
 ['u', 'u', 'u', 'u', 'no u', 'u', 'u']]

>>> muestreo_hmm(ej2_hmm,7) 
[['no l', 'no l', 'no l', 'no l', 'no l', 'no l', 'l'],
 ['no u', 'no u', 'u', 'no u', 'no u', 'no u', 'u']]
```



In [10]:
import random



def muestreo_hmm(hmm,n):
   """Genera una secuencia de estados junto con su correspondiente
   secuencia de observaciones, de longitud n"""
   
   def muestreo_ini():
       """Devuelve aleatoriamente (siguiendo las probabilidades del
       modelo) el primer estado en la secuencia"""
       aleatorio=random.random()
       acum=0
       for x in hmm.estados:
           acum+=hmm.pi[x]
           if acum > aleatorio:
               return x
           
   def muestreo_cond(estado,lista,mat_prob):
       """Esta función se usa para dos tareas muy similares:
          - Dado el estado actual, devolver aleatoriamente (pero
            siguiendo las probabilidades del modelo), el estado sigueinte
            en la secuencia. En ese caso, lista es la lista de estados y
            mat_prob la matriz de probabilidades de transición 
            (en forma de diccionario) 
            
          - Dado el estado actual, devolver aleatoriamento (pero
            siguiendo las probabilidades del modelo), la observación
            correspondiente a ese estado. En ese caso, lista es la lista
            de observables y mat_prob es la matriz de probabilidades de
            observación (en forma de diccionario)."""
       aleatorio=random.random()
       acum=0
       for x in lista:
           acum+=mat_prob[estado,x]
           if acum > aleatorio:
               return x
   secuencia_estados=[muestreo_ini()]
   secuencia_obs=[muestreo_cond(secuencia_estados[-1],hmm.observables,hmm.b)]
   # w = 1
   
   for _ in range(n-1):
       secuencia_estados.append(muestreo_cond(secuencia_estados[-1],hmm.estados,hmm.a)) 
       secuencia_obs.append(muestreo_cond(secuencia_estados[-1],hmm.observables,hmm.b)) #1 no se llama, habría que ponerle una especie de peso
       #  w*= prob en la matriz b de que salga la observación correspondiente secuencia_obs.append(muestreo_cond(secuencia_estados[-1],hmm.observables,hmm.b))
   return secuencia_estados, secuencia_obs
   # return secuencia_estados, w
# va a recibir la secuencia de obs y va a generar no solo una secuencia de estados sino un peso de esa muestra y eso sería retocar en 1

### Ejercicio 3.2

Supongamos ahora que queremos estimar mediante la función de muestreo anterior
probabilidades del tipo  
    
     P(X_t = s_i | E_1 = o_1, ..., E_t = o_t)

Es decir, resolver problemas de "filtrado", como se ha definido en las 
diapositivas

Definir una función:

     estima_filtrado(hmm,observaciones,n_muestras)
    
que recibiendo un modelo oculto de Markov hmm, una secuencia de observaciones
y un entero n_muestras indicando el número de muestras a generar, haga una
estimación de las probabilidades de cada estado dado que se ha observado la 
secuencia de observaciones dada.    

Ejemplos:
Lo probamos con los ejemplos de las diapositivas 
(el resultado puede variar, ya que hay aleatoriedad en los muestreos)

```
>>> estima_filtrado(ej1_hmm,[3,1,3,2],100000)
{'c': 0.647912885662432, 'f': 0.35208711433756806}

>>> estima_filtrado(ej2_hmm,["u","u","no u"],100000)
{'l': 0.18920265780730897, 'no l': 0.8107973421926911}
```

In [13]:
def estima_filtrado(hmm, obs, n):
    ocurrencias_estados = {e:0 for e in hmm.estados}
    n_validas=0
    t=len(obs)
    for _ in range(n):
        secuencia_est, secuencia_obs = muestreo_hmm(hmm, t)
        # secuencia_est, w = muestreo_hmm(hmm, t)

        if secuencia_obs == obs:
            n_validas+=1 # no es necesario
            ocurrencias_estados[secuencia_est[-1]] += 1
            # ocurrencias_estados[secuencia_est[-1]] += w

    return {e:x/n_validas for e,x in ocurrencias_estados.items()}
    # dividir por la suma de lo que salga sin normalizar
# hay que modifica el algoritmo de muestreo para que me diga como de probable es que con esa secuencia de estados me haya dado esa secuencia
# de observaciones

In [14]:
estima_filtrado(ej1_hmm, [3,1,3,2], 100000)

{'c': 0.6420845624385447, 'f': 0.3579154375614553}

## Parte 4: Algoritmo de avance

El algoritmo de avance se define como sigue:

```
Entrada: un modelo oculto de Markov y una secuencia de observaciones, o_1, ..., o_t, 
Salida: probabilidades P(X_t = s_i, E_1 = o_1, ..., E_t = o_t),  1 <= i <= n 

Inicio: alpha(1,si) = b_i(o1)pi_i para 1 <= i <= n
Para k desde 2 a t:
   Para j desde 1 a n:
        alpha(k,sj) = b_j(ok) * sum([a(i,j) * alpha(k-1, si) 
                                      para 1 <= i <= n]) 
Devolver los alpha(t, si) para 1 <= i <= n
```

Una vez que se tienen los alpha(t,si), se puede calcular tanto 
P(E_1 = o_1, ..., E_t = o_t) como P(X_t = s_i | E_1 = o_1, ..., E_t = o_t)
(respectivamente, sumando y normalizando para i=1,...,n).   


### Ejercicio 4.1


Definir la función "avance", que a partir de un modelo oculto de
Markov y una secuencia de observaciones o_1, ..., o_t, calcule tanto
la probabilidad de la secuencia de observaciones P(E_1 = o_1,...,
E_t = o_t), como la lista con las probabilidades P(X_t = s_i | E_1 =
o_1, ...,E_t = o_t), 1 <= i <= n utilizando adecuadamente el
algoritmo de avance anteriormente descrito.

Probarlo con los ejemplos vistos en clase. 

```
>>> avance(ej1_hmm,[3,1,3,2])
(0.010505600000000004, {'f': 0.35290892476393537, 'c': 0.6470910752360646})
>>> avance(ej2_hmm,["u","u","no u"])
(0.12044500000000001, {'l': 0.19066793972352525, 'no l': 0.8093320602764748})
```

In [15]:
def avance(hmm, obs):
    # obs = secuencia o1...ot
    alpha_dict = {e: hmm.b[e,obs[0]]*hmm.pi[e] for e in hmm.estados }
    for o in obs[1:]:
        alpha_dict = {e: hmm.b[e,o]*sum(hmm.a[e1,e]*alpha_dict[e1] for e1 in hmm.estados)
                      for e in hmm.estados}
        # normalizar
    prob_obs=sum(alpha_dict.values())
    return {e:x/prob_obs for e, x in alpha_dict.items()}

In [21]:
avance(ej1_hmm,[3,1,3,2])

{'c': 0.6470910752360646, 'f': 0.35290892476393537}

### Ejercicio 4.2

Definir la función avance_norm que implementa la versión modificada
del algoritmo de avance, en el que en cada iteración se normalizan
las probabilidades calculadas. Igual que en el apartado anterior, se
deben calcular tanto la probabilidad de la secuencia de
observaciones P(E_1 = o_1,..., E_t = o_t), como la lista con las
probabilidades P(X_t = s_i | E_1 = o_1, ...,E_t = o_t), 1 <= i <= n.

In [17]:
def avance_norm(hmm, obs):
    # obs = secuencia o1...ot
    alpha_dict = {e: hmm.b[e,obs[0]]*hmm.pi[e] for e in hmm.estados }
    for o in obs[1:]:
        alpha_dict = {e: hmm.b[e,o]*sum(hmm.a[e1,e]*alpha_dict[e1] for e1 in hmm.estados)
                      for e in hmm.estados}
        prob_obs=sum(alpha_dict.values())
    alpha_dict = {e:x/prob_obs for e, x in alpha_dict.items()}
    return {e:x/prob_obs for e, x in alpha_dict.items()}

In [22]:
avance_norm(ej1_hmm, [3,1,3,2])

{'c': 61.59487085326534, 'f': 33.59245780954303}

### Ejercicio 4.3
    
Utilizar la función anterior para, en el problema 10 del boletín,
comprobar la convergencia de la probabilidad de que haya dormido lo
suficiente la noche anterior para un estudiante muestra todos los
días los ojos rojos y se duerme en clase,



## Parte 5: Algoritmo de Viterbi

El algoritmo de Viterbi se define como sigue:

  - **Entrada**: un modelo oculto de Markov y una secuencia
          de observaciones, o_1, ..., o_t, 

  - **Salida**: La secuencia de estados más probable, dadas las
         observaciones. 

Este algoritmo está explicado en el tema 4 de teoría:

```
Inicio: nu(1,si) = b(i)(o1)pi(i) para 1 <= i <= n
         pr(1,si) = null
Para k desde 2 a t:
   Para j desde 1 a n:
         nu(k,sj) = b(j)(ok) * max([a(i,j) * nu(k-1, si) 
                                    para 1 <= i <= n]) 
         pr(k,sj) = argmax([a(i,j) * nu(k-1, si) para 1 <= i <= n])
Hacer s = argmax([nu(t,si) para 1 <= i <= n])
Devolver la secuencia de estados que lleva hasta s
```

### Ejercicio 5.1

Implementar la función viterbi que use el algoritmo anterior a
partir de un modelo oculto de Markov y una lista de observaciones,
calcule la lista: [s_1, ..., s_t] con la sucesión de estados más
probables usando adecuadamente el algoritmo de Viterbi.

*INDICACIÓN*: Como ayuda, se proporciona la siguiente función viterbi_pre, que sería una
versión preliminar de la función que se pide. Esta función preliminar sólo
calcula los valores nu_k del algoritmo, pero hay que modificarla para
incluir la "infraestructura" necesaria y poder obtener la secuencia de
estados más probable.

```

def viterbi_pre(hmm,observaciones):
        """Versión pre-Viterbi que calcula los nu_k"""
        nu_list=[hmm.b[(e,observaciones[0])]*hmm.pi[e] for e in hmm.estados]
        for o in observaciones[1:]:

            nu_list=[hmm.b[(e,o)]*max(hmm.a[(e1,e)]*nu 
                     for (e1,nu) in zip(hmm.estados,nu_list))
                     for e in hmm.estados]
        return nu_list
```        

### Ejercicio 5.2

Utilizar los ejemplos vistos en la teoría para comprobar la correcta
definición de la función anterior.

## Parte 6: Problema del casino tramposo


En esta parte se pide aplicar las implementaciones anteriores a
un problema simple, que llamaremos el "problema del casino tramposo".

### Ejercicio 6.1

Supongamos que tenemos un casino en el que uno de los juegos de azar
consiste en apostar qué número saldrá al tirar un dado. Cada tirada,
un jugador puede apostar 1 euro a un número entre 1 y 6. Si sale el
número elegido, recibe 6 euros; si no, no recibe nada (es decir, cada vez
que acierta gana 5 euros y cada vez que falla pierde un euro)

Se pide implementar una función resultado_apuesta(l1,l2), que recibiendo dos
secuencias l1 y l2 de la misma longitud, cuyos elementos son números entre 1
y 6, calcula la ganancia (o pérdida) que tiene un jugador que haya apostado
a los números que se indican en l1, y resultando que en realidad los números
que salen son los que se indican en l2. Por ejemplo, si l1=[1,6,5,6,6,2,3,6]
y l2=[1,4,5,6,6,2,2,6], entonces la ganancia es de 28 euros, ya que se
acierta 6 veces y se falla 2 veces.

Nota: las pérdidas se representan como ganancias negativas. 

Ejemplos:

```
>>> resultado_apuesta([1,6,5,6,6,2,3,6],[1,4,5,6,6,2,2,6])
28
>>> resultado_apuesta([1,6,5,6,6,2,3,6],[2,1,3,5,6,2,4,1])
4
>>> resultado_apuesta([1,6,5,6,6,2,3,6],[2,1,3,5,6,1,4,1])
-2
```

### Ejercicio 6.2

Supongamos ahora que nos han dado un chivatazo, y sabemos que el
casino hace trampas: en algunas tiradas, usa un dado trucado. En el
dado trucado, el seis sale con probabilidad 0.5, y el resto de
números salen con igual probabilidad. Por supuesto, no sabemos si en
una jugada se está usando un dado trucado o no, y además esto se
hace de manera aleatoria. Sin embargo, nuestro confidente nos ha
dado cierta información probabilística: nos dice que en la primera
tirada hay 1/3 de probabilidad de que el dado sea trucado; además,
nos dice que usando un dado trucado en una jugada, la probabilidad
de que cambien al dado normal en la siguiente es de 0.8; y que
usando un dado normal en una jugada, la probabilidad que en la
siguiente se siga con un dado normal es de 0.7.


Se pide representar esta infomación usando un modelo oculto de
Markov, generando el correspondiente objeto de la clase hmm, y asignádolo a
una variable de nombre casino_hmm


### Ejercicio 6.3

Ahora nosotros podríamos ir al casino y jugar de dos maneras
distintas, en cada tirada:

- Estrategia 1: independientemente de lo que haya salido en las
  tiradas anteriores, usar nosotros un dado no trucado, y en cada jugada
  tirar nuestro propio dado, y apostar al número que nos haya salido a
  nosotros. 

- Estrategia 2: usar nuestros conocimientos sobre modelos ocultos de
  Markov, y hacer lo siguiente:

  * En la primera tirada, suponer que el dado es no trucado y
    apostar como en la estrategia 1.

  * Para las siguientes tiradas:
      + Calcular cuál es el tipo de dado más probable usado en la tirada
      anterior, dada la secuencia completa de resultados obtenidos hasta esa
      tirada anterior.
      + Puesto que el modelo nos dice que lo más probable es no
      cambiar de dado, suponer que en la siguiente tirada el dado
      usado va a ser de ese mismo tipo que acabamos de calcular
      + Apostar en consecuencia: si como resultado de nuestro cálculo es más
      probable que el dado esté trucado, apostar al 6; si lo más probable es
      que sea un dado normal, apostar siguiendo el método de la estrategia 1.
      


Se pide definir funciones estrategia_1(l) y estrategia_2(l), que
recibiendo una secuencia l de resultados de tiradas, devuelva una
lista de números a los que iríamos apostando, siguendo
respectivamente las estrategias 1 y 2.

#### Ejemplo 

(nótese que no tiene porqué salir lo mismo, ya que hay aleatoriedad) :

Generamos una secuencia de resultados de dados, con la simulación que se 
ha implementado en el apartado anterior:
    
```
>>> l=muestreo_hmm(casino_hmm,20)[1] 
>>> l
[6, 6, 6, 6, 6, 6, 5, 2, 5, 5, 2, 6, 4, 4, 1, 4, 3, 3, 1, 6] 
```

Con la estrategia 1, se genera la siguiente secuencia de 20 apuestas
```
>>> l_ap1=estrategia_1(l)
>>> l_ap1    
[3, 2, 2, 1, 5, 4, 3, 2, 1, 6, 6, 2, 2, 3, 2, 3, 1, 5, 5, 2]
```

En este caso, ¿cuánto hubieramos ganado con esta estrategia?
```
>>> resultado_apuesta(l_ap1,l)    
-14    
```

Sin embargo, con la estrategia 2 se genera la siguiente secuencia 
de apuestas:    
```
>>> l_ap2=estrategia_2(l)
>>> l_ap2    
[1, 6, 6, 6, 6, 6, 6, 6, 2, 1, 1, 6, 6, 6, 1, 2, 1, 3, 1, 2]
```

¿Cuánto hubieramos ganado con esta estrategia?
```
>>> resultado_apuesta(l_ap2,l)     
34
```