In [2]:
# Paquete Numpy
import numpy as np

# Generación de números pseudoaleatorios
from numpy import random as rd

# Módulo para las gráficas
from matplotlib import pyplot as plt

# Análisis de datos
import pandas as pd
from pandas import DataFrame as df

<h1 style="background-color:Green;font-size:36pt;color:white">MODELOS DE SIMULACIÓN </h1>

## Universidad Tecnológica La Salle - León, Nicaragua
### Giusseppe Benito Bervis Quintero

# Generador de números pseudoaleatorios (GNPA)

Cuando se tiene una simulación computacional que requiere una gran cantidad de números aleatorios son más prácticos y fiables algoritmos determinísticos, con alguna base matemática sólida, para generar números aleatorios, en comparación con métodos físicos como la extracción de bolas de una tómbola. 

La generación de sucesiones aleatorias reales utilizando algoritmos deterministas es imposible; a lo más, sucesiones **pseudoaleatorias** pueden ser generadas. Estas son, en apariencia, sucesiones aleatorias que en realidad son perfectamente predecibles y que se repiten después de cierta cantidad de ejecuciones. Un generador de números pseudoaleatorios es un algoritmo diseñado para producir una sucesión de números que aparentan ser generados aleatoriamente.

## Formas de generación de números **pseudoaleatorios**

Existen tres formas de obtener números uniformes: 
- La provisión externa, lo que implica tener números aleatorios calculados de antemano y tratar estos números como datos de entrada para el problema que se esta simulando. 
- La generación interna a partir de un proceso físico, lo que implica utilizar algún aditamento especial para registrar los resultados de un proceso aleatorio. 
- La generación interna de sucesiones por medio de una relación de recurrencia. Se produce una sucesión de números que asemeja, sin serlo realmente, una sucesión de realizaciones de variables aleatorias independientes e idénticamente distribuidas U(0,1). Es así que estos números se llaman **pseudoaleatorios** y el algoritmo que los produce se llama **generador de números pseudoaleatorios**.

## Funcionamiento de un generador de números pseudoaleatorios

El funcionamiento de un generador de números pseudoaleatorios es como sigue:
1. Se elige una semilla inicial cualquiera $𝑥_0$.
2. Se genera una sucesión de estados $𝑥_𝑛  \in 𝑋$, $𝑛 \geq 1$, para $𝑋$ finito, mediante una relación $𝑥_𝑛  = 𝑇(𝑥_{𝑛−1})$.
3. Se obtiene la sucesión de números pseudoaleatorios $𝑢_𝑛$, $𝑛 \geq 1$ mediante una relación $𝑢_𝑛  = 𝐺(𝑥_𝑛 )$.

<FONT COLOR= 'RED'> **Observaciones:** </FONT>
- Como $𝑋$ es finito, la sucesión de estados de un generador de números pseudoaletorios es periódica. En algún momento ocurrirá $𝑥_𝑗  = 𝑥_𝑖$  para algún $𝑗 > 𝑖$, y a partir de ese instante, $𝑥_𝑗 + 𝑘 = 𝑥_𝑖 + 𝑘$, y por lo tanto, $𝑢_𝑗 + 𝑘 = 𝑢_𝑖 + 𝑘$, para todo $𝑘 \geq 0$. 
- El período de un generador es el menor entero $𝑝 > 0$, tal que para algún entero $𝑟 > 0$, se verifica que $𝑥_{𝑝+𝑘} = 𝑥_𝑘$, para todo $𝑘 \geq 𝑟$.
- Si el período de un generador coincide con la cardinalidad de $𝑋$, él se llama de período completo.

## Pros y contras de los generadores de números aleatorios
Una rutina de generación de números aleatorios debe ser:
<ul>
    <li> Replicable </li>
    <li> Rápida </li>
    <li> No tener saltos grandes entre dos números generados</li>
    <li> Tener un período de generación suficientemente grande (para que no hayan repeticiones en pocas generaciones) </li>
    <li> Generar números con propiedades estadísticas lo más parecido posible a las distribuciones ideales que se quieren generar </li>
</ul>

Los más comunes contras de los generadores de números aleatorios son:
<ul>
    <li> Los números no están uniformemente distribuidos </li>
    <li> Discretización de los números generados </li>
    <li> Media o varianza incorrectas</li>
    <li> Presencia de variaciones cíclicas</li>
</ul>

## Algoritmos de generación de números aleatorios
El primero que trató con los problemas de generación de números aleatorios fue John von Neumann, en 1949. Propuso un método llamado **middle-square**. Este método nos permite entender algunas características importantes del proceso de generación de números aleatorios. Para empezar, necesitamos dar una entrada como una semilla **(seed)** o un valor que inicia la sucesión. Esto es necesario para generar diferentes sucesiones cada vez. Sin embargo, es importante asegurar que el buen desempeño del generador no depende de la semilla usada. A partir de aquí, aparece la primera falla del método del **middle-square**, es decir, al usar el valor cero como
una semilla, solo se obtendrá una secuencia de ceros.

Otro inconveniente de este método es la repetitividad de las sucesiones. Como en todos los generadores de números aleatorios, cada valor depende del valor anterior, y, a lo más, de las variables de estado interno del generador. Dado que se trata de un número limitado de dígitos, la sucesión solo se puede repetir a partir de cierto punto. La longitud de la secuencia, antes de que comience a repetirse, se llama **período**. Un período largo es importante porque muchas aplicaciones prácticas requieren una gran cantidad de datos aleatorios y una secuencia repetitiva puede ser menos efectiva. En tales casos, es importante que la elección de la semilla no influya en los posibles resultados.

Otro aspecto importante es la eficiencia del algoritmo. El tamaño de los valores de los datos de salida y el estado interno y, por lo tanto, la entrada del generador (semilla), a menudo son características intrínsecas del algoritmo y permanecen constantes. Por ello, la eficiencia de un generador de números pseudoaleatorios debe evaluarse no tanto en términos de complejidad computacional, sino en términos de la posibilidad de una implementación rápida y eficiente de las arquitecturas de cálculo disponibles. De hecho, dependiendo de la arquitectura en la que esté trabajando, la elección de diferentes generadores de números pseudoaleatorios o diferentes parámetros de diseño de un determinado de estos algoritmos puede resultar en una implementación más rápida en muchos órdenes de magnitud.

<h1 style="background-color:Green;font-size:36pt;color:white"> Generadores congruenciales lineales (GCL)</h1>

Introducido por Lehmer en 1951, el **Generador Congruencial Lineal** esuno de los métodos más comunes para la generación de números pseudoaleatorios, el cual es simple de entender e implementar; y es también, computacionalmente, bueno. La relación de recursividad está definida por la siguiente ecuación:
$$x_{n+1} = (a x_{n} + c) \mod m$$
Donde:
- $a$ es el multiplicador.
- $c$ es una constante aditiva (también llamado incremento).
- $m$ es el módulo. $(m > x_0, m>a \text{ y } m>c)$
- $x_0$ es la "semilla" (seed)
- Cabe mencionar que $a, c, m, x_0 \in \mathbb{Z}^{+}$, es decir deben ser enteros positivos. 

La relación de recurrencia nos dice que $x_{n+1}$ es el residuo de dividir $a x_{n} + c$ entre el módulo. Lo anterior significa que los valores posibles de $x_{n+1}$ son $0,1,2,3, \ldots, m-1$; es decir, $m$ representa el número posible de valores diferentes que pueden ser generados.

La técnica congruencial lineal tiene las siguientes características:
- Es cíclica con un periodo que es aproximadamente igual a $m$.
- Los números generados son discretos.
- Si $c = 0$, el generador se llama multiplicativo; si no se llama mixto.

**Ejercicio** Usando la relación del Generador Congruencial Lineal, genere 17 números pseudoaleatorios con los siguientes datos: 
$$a = 2, c = 4, m = 5, x_0 = 3$$
**¿Cuál es el periodo de estos números?**

In [15]:
a = 2
c = 4
m = 5
x = 3

for i in range (17):
    x = np.mod(a*x+c, m)
    print(x)

0
4
2
3
0
4
2
3
0
4
2
3
0
4
2
3
0


**Solución:** Puede verse que el periodo 5, el número 0 se vuelve a repetir cada 5 números generados. Por eso se elige un número $m$ lo más grande posible.

**Ejercicio** Usando la relación del Generador Congruencial Lineal, determine de qué tipo es el generador (multiplicativo o mixto) y determine su período calculando los primeros números pseudoaleatorios generados por el generador congruencial:
$$𝑥_𝑛 = (5𝑥_{𝑛−1}+1)\text{ 𝑚𝑜𝑑 }9\text{, con }𝑥_0 = 1$$

In [1]:
x = 1 #Definiendo la semilla
periodo = 0 # Para cálcular el valor del periodo

print(x)

while True:
    x = (5*x + 1) % 9
        
    # Actualizando el periodo
    periodo += 1
    
    print(x)
    if x == 1:
        break
    
    
print(f"El periodo es {periodo}")

1
6
4
3
7
0
1
El periodo es 6


# Usando los GCL para generar $U(0,1)$

Es posible generar números pseudoaleatorios que sigan una distribución uniforme en el intervalo $[0, 1]$, para esto consideremos una sucesión de números pseudoaleatorios $u_n$, donde $n \geq 1$. Dicha sucesión estará generada por la fórmula:
$$u_i = \frac{x_i}{m}$$
Donde:
- $x_i$ es el término $i$-ésimo de un GCL.
- $m$ es el módulo de dicho GCL.

<FONT COLOR= 'RED'> **Desventajas de este método:** </FONT>
- Cada $x_i$ está completamente caracterizado por $a, b, m$ y $x_0$, así que no son aleatorios. Sin embargo existen formas de elegir los parámetros, de tal forma que la sucesión $u_n, n \geq 1$ asemeje a una sucesión de números $U(0; 1)$.
- Los $u_i$ pueden ser solo $0, \frac{1}{m}, \frac{2}{m}, \ldots \frac{(m- 1)}{m}$, pero tomando $m$ suficientemente grande, por ejemplo $m \geq 10^9$, el conjunto de posibles valores es suficientemente denso en $[0,1]$ para asemejar a una variable $U(0; 1)$.

**Ejercicio** Tomando el GCL, del ejemplo anterior, $𝑥_𝑛 = (5𝑥_{𝑛−1}+1)\text{ 𝑚𝑜𝑑 }9\text{, con }𝑥_0 = 1$ genere números que siguen una distribución $U(0,1)$.

In [14]:
x = 1 #Definiendo la semilla
periodo = 0 # Para cálcular el valor del periodo

print(x / 9)

while True:
    x = (5*x + 1) % 9
    
    ui = x / 9
    # Actualizando el periodo
    periodo += 1
    
    if x == 1:
        break
    
    print(ui)

0.1111111111111111
0.6666666666666666
0.4444444444444444
0.3333333333333333
0.7777777777777778
0.0


**Ejercicio** Tomando el GCL, del ejemplo anterior, $𝑥_𝑛 = (5𝑥_{𝑛−1} + 1)\text{ 𝑚𝑜𝑑 }512\text{, con }𝑥_0 = 1$ genere números que siguen una distribución $U(0,1)$. (No los imprima, solo determine la cantidad de elementos generados).
Piense en cómo podría detener el algoritmo.

In [60]:
x = 1 #Definiendo la semilla

valores = [x] # Consideramos una lista para guardar los valores generados

periodo = 0 # Iniciamos el contador del periodo

# Usamos While porque no sabemos cuándo va a terminar
while True:
    x = (5*x + 1) % 512 # Realizamos las operaciones del GCL
    
    # Si algún valor generado se repite, el algoritmo se detiene
    if x in valores:
        break
    
    # Si no se detiene, agregamos el 
    valores.append(x)
    
    # Cálculamos los elementos de la sucesión
    ui = x / 512
    #print(ui)
    
    # Actualizando el periodo
    periodo += 1
    
    datos.append(ui)

print('El periodo es:', periodo)

El periodo es: 511


**Para ver posibles estrategias de selección de $m$ ver:** Coss, R. Simulación. Un enfoque práctico. Limusa Noriega editores. p. 22.

<h3 style="background-color:red;font-size:12pt;color:white">Existen otros métodos para la generación de números pseudoaleatorios, para distribuciones de probabilidad específicas, pero no los estudiaremos. Usaremos los incluidos en modulos de Python.</h3>

Para ver más métodos de generación de números pseudoaleatorios, ver: Coss, R. Simulación. Un enfoque práctico. Limusa Noriega editores.