# Suma de variables uniformes

Ejemplo del teorema central del límite. El código simula n variables continuas con distribución uniforme entre 0 y 1. Luego construye un histograma de frecuencias con la suma de las variables y lo compara con una distribución Normal.

$X = \sum_{i=1}^{n} X_i, \; X_i \sim \mathrm{U}(0,1)$

In [None]:
import math
import numpy as np
from scipy.stats import norm

## Simulación Monte Carlo

Número de variables a sumar

In [None]:
nvariables = 10

Número de simulaciones

In [None]:
nsimulations = 100000

Generador de números aleatorios

In [None]:
rng = np.random.default_rng(seed=6870)

Arreglo para guardar los datos

In [None]:
data = []

In [None]:
for i in range(nsimulations):
    # print("Iteración ", i)
    x = rng.random(size=nvariables)     # distribución uniforme [0,1)
    # print("x = ", x)
    x_sum = x.sum()
    # print("z = ", z)
    data.append(x_sum)

## Momentos de X

In [None]:
mu = nvariables / 2
print(f'Media: {mu}')

In [None]:
sigma = math.sqrt(nvariables/12)
print(f'Desviación estándar: {sigma}')

## Histograma de frecuencia

In [None]:
import danatools
xmin, xmax = mu-3*sigma, mu+3*sigma
frequency, bin_centres = danatools.histogram(data, bins=20, range=[xmin, xmax])

Normalización de la distribución

In [None]:
# same width for all bins
bin_width = bin_centres[1] - bin_centres[0]
scale_factor = nsimulations * bin_width
scale_factor

Frecuencia relativa

In [None]:
relative_frequency = frequency / scale_factor

## Distribución Normal

In [None]:
x = np.linspace(xmin, xmax, 100)
y = norm.pdf(x, loc=mu, scale=sigma)

In [None]:
import matplotlib.pyplot as plt
fig, ax = plt.subplots()
ax.set_xlabel("$X = \sum X_i$")
ax.set_ylabel("Probability density")
ax.plot(bin_centres, relative_frequency, ls='None', marker='o', label="Monte Carlo")
ax.plot(x, y, ls='--', label="PDF")
ax.set_ylim(bottom=0)
ax.legend()