# **Procesos Estocásticos**

## Procesos estocásticos en tiempo discreto

*Autor: Daniel Beteta Francisco*

# **Librerías usadas**

In [None]:
import math
import scipy.stats

import numpy as np

from typing import List, Tuple
from tabulate import tabulate

SEED=100

# **Ejercicio 1**

**Se dibuja un cuadrado unitario (de lado 1) con un circulo unitario (de diámetro 1) inscrito. Se generan puntos aleatorios con distribución uniforme dentro del cuadrado.**

**1. ¿Cuál es el universo de eventos de este experimento?**

Sea $D$ cuando un punto cae dentro del círculo y $F$ cuando un punto cae fuera del círculo.

El universo de eventos del experimento será $[D, F]$.

**2. ¿Cuál es la probabilidad que un punto generado esté incluido dentro del cı́rculo?**

La probabilidad de que un punto generado esté incluido dentro del círculo será $\frac{\sum D}{T}$.

Siendo $T$ el total de puntos generados.

Además, si quisieramos saber si un punto de coordenadas $(x_p, y_p)$ está dentro del círculo, deberíamos comprobar si su distancia del centro es menor al radio. Es decir que para nuestro caso satisfaga que $\sqrt{(x_p - x_c)^2 + (y_p - y_c)^2} < 0.5$ siendo $(x_c, y_c)$ las coordenadas del centro.

**3. Usar la respuesta del punto 2 para escribir un programa que calcule π con tres cifras significativas. Entregar el código (es corto...), el valor conseguido (primera cinco cifras decimales), explicar el criterio de parada que se ha usado para determinar cuando terminar el cálculo (sin usar el valor de π, claro...) y el número de puntos que se han generado.**

In [None]:
np.random.seed(SEED)
list_amount_of_points = [10, 100, 1000, 10000, 100000, 1000000, 10000000, 100000000]
radius = x_c = y_c = 0.5
square_area = 1**2

for amount_of_points in list_amount_of_points:
  amount_of_points_inside_circle = 0 
  x_values = scipy.stats.uniform.rvs(size=amount_of_points)
  y_values = scipy.stats.uniform.rvs(size=amount_of_points)
  
  for x_p, y_p in zip(x_values, y_values):
    distance_to_the_center = math.sqrt((x_p - x_c)**2 + (y_p - y_c)**2)
    if distance_to_the_center < radius:
      amount_of_points_inside_circle += 1
  
  probability_of_point_inside_circle = amount_of_points_inside_circle / amount_of_points
  circle_area = square_area * probability_of_point_inside_circle
  pi_value = circle_area / radius**2
  print(f'Pi value with {amount_of_points} points generated: {pi_value: .5f}')

Pi value with 10 points generated:  2.80000
Pi value with 100 points generated:  3.12000
Pi value with 1000 points generated:  3.15200
Pi value with 10000 points generated:  3.14360
Pi value with 100000 points generated:  3.14344
Pi value with 1000000 points generated:  3.14214
Pi value with 10000000 points generated:  3.14140
Pi value with 100000000 points generated:  3.14162


La lógica principal del script realizado se encuentra en intentar estimar el área del círculo, para tras ello despejando su fórmula se pueda estimar el valor de pi:
$
\pi = \frac{A_c}{r^2}
$

Siendp $A_c$ el área del círculo y $r$ el radio del círculo.

Para estimar dicha área el proceso realizado ha sido generar de $10$ hasta $100000000$ puntos de una distribución uniforme y con el criterio explicado en el apartado anterior, calcular la probabilidad de que un punto caiga dentro del círculo.Ya que con dicha probabilidad y el área del cuadrado, se puede estimar el área del círculo.

Como se puede observar a medida que se aumenta el número de puntos generados el área del círculo es más precisa y por tanto, así lo es el valor de pi $(3.14159)$.

# **Ejercicio 2**

**Como ejercicio de probabilidad, este es muy fácil, pero es muy gracioso, me gusta, y quiero preguntarlo. Se trata del juego de las tres puertas, también conocido como el Monty Hall problem.**

**Hay tres puertas, y detrás de una de ellas hay un premio. El presentador os pide elegir una, sin abrirla. Después, abre una de las otras dos, y os muestra que allı́ no está el premio.**

**Finalmente os pide si queréis cambiar la puerta o confirmar la elección inicial.¿Cuál es la decisión que maximiza la probabilidad de ganar, y que probabilidad de ganar os da?**

Sea $X$ cuando el concursante elige inicialmente la puerta correcta e $Y$ cuando el concursante elige la opción correcta al cambiar de puerta.

Se tiene que:
* $P(X)$ es de $1/3$ ya que el concursante elige de forma aleatoria entre las tres opciones.
* $P(\bar{X}) = 1 - P(X) = 2/3$.
* $P(Y|X) = 0$ ya que ambos eventos son mutuamente excluyentes: no se puede elegir la puerta con premio inicialmente y elegir la puerta con premio tras cambiar de opción, ambas a la vez.
* $P(Y|\bar{X}) = 1$ ya que si inicialmente se ha elegido incorrectamente, cambiar de opción (una vez abierta una de las puertas por el presentador), siempre resultará en elegir la puerta correcta.

Por tanto, la $P(Y) = P(Y, X) + P(Y, \bar{X}) = P(Y|X)*P(X) + P(Y|\bar{X})*P(\bar{X}) = 0*1/3 + 1*2/3 = 2/3.$

Luego como $P(Y) > P(X)$ la decisión que maximiza la probalidad de ganar es la de cambiar de puerta, $P(Y) = 2/3$. 

# **Ejercicio 3**

**Dada una cadena de Markov con un conjunto finito de estados $[1, ..., M]$, sea $p_m(t)$ la probabilidad que la cadena esté en el estado $m$ al instante $t$. Se defina el vector:**

$p(t) = [p_1(t), ..., p_m(t)]'$

**1. Usar la definición de la matrix de transición P para demostrar que**

$p'(t+1) = p'(t)P$

**Y por tanto, si $λ$ es la distribución inicial**

$p'(t) = λ'P^t$


Dado que:

$
P(X_1 = j) = \sum_{i\epsilon I} \lambda_i P(X_1 = j) = \sum_{i \epsilon I} \lambda_i p_{ij}
$

$
P(X_2 = j) = \sum_{i, k} \lambda_i P(X_1 = k, X_2 = j) = \sum_{i, k} \lambda_i p_{ik} p_{kj} = (\lambda P^2)_j
$

Se puede generalizar como:

$
P(X_t = j) = \sum_{i_0, ..., i_t-1} \lambda_{i_0} p_{i_0i_1} ... p_{i_t-1j} = (\lambda P^t)_j
$

**Consideremos la siguiente cadena de Markov**

![markov](markov.png)

**Se asuma que cada estado tiene un "self-loop" con la probabilidad necesaria para que la suma de las probabilidades en salida sea 1. Escribir un programa (son como mucho 10 lı́neas en python... nada de que preocuparse) para contestar a las preguntas siguientes:**

In [None]:
TRANSITION_MATRIX = np.array(
    [
     [0.5, 0.5, 0, 0, 0, 0],
     [0, 0.5, 0.5, 0, 0, 0],
     [0.25, 0, 0.25, 0.25, 0.25, 0],
     [0.25, 0, 0, 0.5, 0.25, 0],
     [0, 0, 0, 0, 0.5, 0.5],
     [0, 0, 0, 0.25, 0.5, 0.25],
    ]
)

LIST_OF_AMOUNTS_OF_STEPS = [2, 10, 100]

In [None]:
def get_states_probability_fancy(initial_state: np.ndarray, 
                                 transition_matrix: np.ndarray, 
                                 amount_of_steps: int) -> Tuple[List[str], List[float]]:
    headers = []
    amount_of_states = 6
    for i in range(amount_of_states+1):
      headers.append("P_{}({})".format(i, amount_of_steps))

    array_of_states_probability = _get_array_of_states_probability(
        initial_state, TRANSITION_MATRIX, amount_of_steps
    )

    return headers, [(array_of_states_probability).tolist()]


def _get_array_of_states_probability(initial_state: np.ndarray, 
                                     transition_matrix: np.ndarray, 
                                     amount_of_steps: int) -> np.ndarray:

  return initial_state @ np.linalg.matrix_power(TRANSITION_MATRIX, amount_of_steps)

**2. Considerando $λ = [1, 0, 0, 0, 0, 0]'$ (es decir: se empieza en $t=0$ en el estado 0), calcular $p(2)$, $p(10)$, $p(100)$.**

In [None]:
initial_state = np.array([1, 0, 0, 0, 0, 0])

In [None]:
for amount_of_steps in LIST_OF_AMOUNTS_OF_STEPS:
  headers, list_of_states_percentages = get_states_probability_fancy(
      initial_state, TRANSITION_MATRIX, amount_of_steps
  )

  print(tabulate(list_of_states_percentages, headers=headers, tablefmt='fancy_grid'))

╒══════════╤══════════╤══════════╤══════════╤══════════╤══════════╕
│   P_0(2) │   P_1(2) │   P_2(2) │   P_3(2) │   P_4(2) │   P_5(2) │
╞══════════╪══════════╪══════════╪══════════╪══════════╪══════════╡
│     0.25 │      0.5 │     0.25 │        0 │        0 │        0 │
╘══════════╧══════════╧══════════╧══════════╧══════════╧══════════╛
╒═══════════╤═══════════╤═══════════╤═══════════╤═══════════╤═══════════╕
│   P_0(10) │   P_1(10) │   P_2(10) │   P_3(10) │   P_4(10) │   P_5(10) │
╞═══════════╪═══════════╪═══════════╪═══════════╪═══════════╪═══════════╡
│   0.13752 │  0.155167 │  0.113911 │  0.140522 │  0.279381 │    0.1735 │
╘═══════════╧═══════════╧═══════════╧═══════════╧═══════════╧═══════════╛
╒════════════╤════════════╤════════════╤════════════╤════════════╤════════════╕
│   P_0(100) │   P_1(100) │   P_2(100) │   P_3(100) │   P_4(100) │   P_5(100) │
╞════════════╪════════════╪════════════╪════════════╪════════════╪════════════╡
│   0.111111 │   0.111111 │  0.0740741 │   0.14814

**3. Repetir el cálculo de $p(2)$, $p(10)$, $p(100)$ con $λ = [0, 0, 1, 0, 0, 0]′$.**

In [None]:
initial_state = np.array([0, 0, 1, 0, 0, 0])

In [None]:
for amount_of_steps in LIST_OF_AMOUNTS_OF_STEPS:
  headers, list_of_states_percentages = get_states_probability_fancy(
      initial_state, TRANSITION_MATRIX, amount_of_steps
  )

  print(tabulate(list_of_states_percentages, headers=headers, tablefmt='fancy_grid'))

╒══════════╤══════════╤══════════╤══════════╤══════════╤══════════╕
│   P_0(2) │   P_1(2) │   P_2(2) │   P_3(2) │   P_4(2) │   P_5(2) │
╞══════════╪══════════╪══════════╪══════════╪══════════╪══════════╡
│     0.25 │    0.125 │   0.0625 │   0.1875 │     0.25 │    0.125 │
╘══════════╧══════════╧══════════╧══════════╧══════════╧══════════╛
╒═══════════╤═══════════╤═══════════╤═══════════╤═══════════╤═══════════╕
│   P_0(10) │   P_1(10) │   P_2(10) │   P_3(10) │   P_4(10) │   P_5(10) │
╞═══════════╪═══════════╪═══════════╪═══════════╪═══════════╪═══════════╡
│  0.120958 │  0.127216 │ 0.0884142 │  0.145421 │  0.313589 │  0.204401 │
╘═══════════╧═══════════╧═══════════╧═══════════╧═══════════╧═══════════╛
╒════════════╤════════════╤════════════╤════════════╤════════════╤════════════╕
│   P_0(100) │   P_1(100) │   P_2(100) │   P_3(100) │   P_4(100) │   P_5(100) │
╞════════════╪════════════╪════════════╪════════════╪════════════╪════════════╡
│   0.111111 │   0.111111 │  0.0740741 │   0.14814

**4. Repetir el cálculo de $p(2)$, $p(10)$, $p(100)$ con $λ = [0, 0, 0, 0, 0, 1]′$.**

In [None]:
initial_state = np.array([0, 0, 0, 0, 0, 1])

In [None]:
for amount_of_steps in LIST_OF_AMOUNTS_OF_STEPS:
  headers, list_of_states_percentages = get_states_probability_fancy(
      initial_state, TRANSITION_MATRIX, amount_of_steps
  )

  print(tabulate(list_of_states_percentages, headers=headers, tablefmt='fancy_grid'))

╒══════════╤══════════╤══════════╤══════════╤══════════╤══════════╕
│   P_0(2) │   P_1(2) │   P_2(2) │   P_3(2) │   P_4(2) │   P_5(2) │
╞══════════╪══════════╪══════════╪══════════╪══════════╪══════════╡
│   0.0625 │        0 │        0 │   0.1875 │   0.4375 │   0.3125 │
╘══════════╧══════════╧══════════╧══════════╧══════════╧══════════╛
╒═══════════╤═══════════╤═══════════╤═══════════╤═══════════╤═══════════╕
│   P_0(10) │   P_1(10) │   P_2(10) │   P_3(10) │   P_4(10) │   P_5(10) │
╞═══════════╪═══════════╪═══════════╪═══════════╪═══════════╪═══════════╡
│  0.102201 │ 0.0963154 │ 0.0606956 │  0.150693 │  0.351478 │  0.238618 │
╘═══════════╧═══════════╧═══════════╧═══════════╧═══════════╧═══════════╛
╒════════════╤════════════╤════════════╤════════════╤════════════╤════════════╕
│   P_0(100) │   P_1(100) │   P_2(100) │   P_3(100) │   P_4(100) │   P_5(100) │
╞════════════╪════════════╪════════════╪════════════╪════════════╪════════════╡
│   0.111111 │   0.111111 │  0.0740741 │   0.14814

**5. ¿Cómo cambian los tres vectores $p(2)$, $p(10)$, $p(100)$? ¿Cómo cambia su dependencia de las condiciones iniciales? ¿Qué implica esto para $p(∞)$?**

Según va aumentando la cantidad de pasos, el vector de probabilidades de los distintos estados va convergiendo según el grado de entrada frente el grado de salida de cada nodo y su respectiva ponderación o probabilidad.

Aunque en $t=100$ acaba convergiendo todos al mismo vector de probabilidades de estado, tanto en $t=2$ como en $t=10$ se ve como el estado inicial condiciona de forma relevante dicho vector. 

Por último, con respecto a $P(∞)$ se comprueba en el output del código de la siguiente celda que, independientemente del estado inicial, para esta cadena de Markov, se converge al ya mencionado vector de probabilidades de estado.

Analizando los casos extremos, esto es, el estado de mayor probabilidad, $P_4$, y el de menor probabilidad, $P_2$, se puede ver en el grafo que el primero es el que recibe una mayor cantidad de probabilidad del resto de estados: $P_{24}+ P_{34} + P_{54} = 1$. Y el segundo el que reparte una mayor cantidad de probabilidad al resto de nodos: $P_{20} + P_{23} + P_{24} = 0.75$. Luego parece sensato el resultado obtenido.

In [None]:
all_initial_states = [
    np.array([1, 0, 0, 0, 0, 0]),
    np.array([0, 1, 0, 0, 0, 0]),
    np.array([0, 0, 1, 0, 0, 0]),
    np.array([0, 0, 0, 1, 0, 0]),
    np.array([0, 0, 0, 0, 1, 0]),
    np.array([0, 0, 0, 0, 0, 1]),
]

for initial_state in all_initial_states:
  headers, list_of_states_percentages = get_states_probability_fancy(
      initial_state, TRANSITION_MATRIX, 10000
  )

  print(tabulate(list_of_states_percentages, headers=headers, tablefmt='fancy_grid'))

╒══════════════╤══════════════╤══════════════╤══════════════╤══════════════╤══════════════╕
│   P_0(10000) │   P_1(10000) │   P_2(10000) │   P_3(10000) │   P_4(10000) │   P_5(10000) │
╞══════════════╪══════════════╪══════════════╪══════════════╪══════════════╪══════════════╡
│     0.111111 │     0.111111 │    0.0740741 │     0.148148 │     0.333333 │     0.222222 │
╘══════════════╧══════════════╧══════════════╧══════════════╧══════════════╧══════════════╛
╒══════════════╤══════════════╤══════════════╤══════════════╤══════════════╤══════════════╕
│   P_0(10000) │   P_1(10000) │   P_2(10000) │   P_3(10000) │   P_4(10000) │   P_5(10000) │
╞══════════════╪══════════════╪══════════════╪══════════════╪══════════════╪══════════════╡
│     0.111111 │     0.111111 │    0.0740741 │     0.148148 │     0.333333 │     0.222222 │
╘══════════════╧══════════════╧══════════════╧══════════════╧══════════════╧══════════════╛
╒══════════════╤══════════════╤══════════════╤══════════════╤══════════════╤════