# Practica sobre variable aleatoria

## Objetivos:
1. Evaluar diferentes condiciones necesarias y suficientes para el cumplimiento del Teorema del Límite Central.
2. Evaluar el concepto de ergocicidad en un proceso aleatorio. Para el caso específico del Movimiento Browniano.
3. Aplicar los conceptos de pruebas de hipótesis y normalidad para comparar grupos de datos.

# Punto 1: Teorema del límite central



Desarrollo:

La media ($\mu$) y la desviación estándar ($\sigma$) de una Variable Aleatoria (VA) Uniforme ~ [a,b] está dada por la expresión: $\mu = \frac{a+b}{2}$ y $\sigma^2 = \frac{1}{12}(b-a)^2$.


1.1. Considere la suma de $n$ distribuciones con $n \in \{2,5,100,1000\}$ y grafique el histograma resultante para cada caso.

1.2. ¿Cuál es la distribución resultante del punto 1? Estime la media y la desviación estándar del resultado de la suma.
Compare con el caso teórico del punto anterior.

1.3. Considere ahora una VA exponencial, cuya distribución es: $F(\lambda)=\lambda e^{-\lambda x}$, con $\lambda=5$.
Realice el mismo procedimiento que realizó con las VA Uniformes y obtenga la media y desviación estandar, teniendo en cuenta que: $\mu = \sigma = \frac{1}{λ}$. Describa el comportamiento que se observa al realizar la suma de las $n$ distribuciones exponenciales.

1.4. Realice lo indicado en el ítem 1.2 para este caso con exponenciales.
Compare el resultado con VAs uniformes vs. VA exponenciales y concluya.


## Punto 2: Suma de VAs con diferentes distribuciones

2.1. Considere 120 distribuciones uniformes, en grupos de 20 con diferentes valores de a y b por grupo. Muestre que la suma total converge a una distribución Gaussiana después de 1000 realizaciones.



## Suma de VAs con diferentes distribuciones (Uniforme, Exponencial, Gaussiana)

2.2. Considere ahora 1000 realizaciones de 30 distribuciones, así: 10 Uniformes, 10 Exponenciales, y 10 Gaussianas. Use a=10 y b=20, $\lambda=5$, y $\mu =30$, $\sigma=5$. Muestre que el ensamble converge a una distribución Gaussiana. Calcule la media y la desviación estándar del ensamble resultante. Concluya.

## Suma de VAs correlacionadas

2.3. Considere los archivos "Vas_exponential_correlated.csv" y "Vas_exponential_uncorrelated.csv". Cada uno corresponde a 1000 realizaciones de 20 distribuciones. Encuentre el ensamble en cada caso, dibuje y compare. Qué puede concluir con la información que ha encontrado hasta ahora?

Calcule ahora, para cada caso, el coeficiente de correlación de Pearson (usando la función "pearsonr") entre cada una de las distribuciones y todas las demás. Deberá encontrar una matriz de [20 X 20], qué puede concluir ahora?

# Punto 3: Procesos aleatorios



## 3.1. Señal cosenoidal con fase aleatoria

3.1.1 Genere N arreglos del proceso aleatorio $cos(2 \pi f_c t + Φ) + 1$ donde $Φ \thicksim U [0,2\pi]$ y grafique al menos 5 de ellos en una figura.

3.1.2 Varíe el número de arreglos entre [10, 100, 1000], calcule la media a travez del ensamble para cada tiempo y grafique el resultado. Qué puede concluir del comportamiento de la media del ensamble al variar la cantidad de arreglos generados del proceso aleatorio?

3.1.3 Calcule la media temporal para cada arreglo y grafique el resultado. Qué puede inferir del proceso aleatorio?



## Movimiento Browniano

# Punto 4: Procesos aleatorios y ergodicidad, caso del movimiento browniano.

4.1. Considere la función "brownian motion(M,T)" donde M=1000 y T=10. Genere el ensamble del proceso aleatorio, dibújelo y calcule la media del ensamble (para todas las filas del ensamble) y la media temporal (para todas las columnas). Qué puede concluir?




In [None]:
def brownian_motion(M,T):
  # M: Numero de puntos en el eje temporal

  dt = T / M  # Time step

  # Simulate multiple realizations of Brownian motion

  # Generate the increments for Brownian motion
  dW = np.random.normal(0, np.sqrt(dt), M-1)
  W_t = np.concatenate(([0], np.cumsum(dW)))  # Inicia en W(0) = 0 y accumacumula los incrementos
  return W_t

# Punto 5: Test estadísticos

**5.1 Escenario 1:** En el archivo `Muestras_1.csv` se encuentran los datos de las edades para participantes de dos grupos diferentes. La primera columna de la tabla en el archivo indica el grupo y la seguna la edad de cada persona. En este caso se desea determinar si ambos grupos tienen edades similares.

5.1.1. Dibuje el histograma de las edades de ambos grupos (un color por grupo) y calcule la media y desviación estándar de la edad de cada grupo. Diga si las medias son similares.

5.1.2. Utilice la función "shapiro" de la librería  "stats" de "scipy" y haga una prueba de Shapiro-Wilk para determinar si la distribución de cada grupo es Normal (p-value > 0.05).

- Verifique si las dos distribuciones son Normales.  Proceda haciendo la prueba estadística que aplica para este caso y determine si hay una diferencia estadísticamente significativa entre los dos grupos. Explique qué prueba hizo y justifique.


---


**5.2 Escenario 2:** En el archivo `Muestras_2.csv` se encuentran los puntajes de un clasificador (columna 2) para dos grupos (la columna 1 indica una contiene para cada grupo). Se quiere determinar si los *scores* para cada grupo son estadísticamente diferentes; es decir, el clasificador logra diferenciar entre ambos grupos.

Repita los ejercicios del ítem 5.1. y explique.

---

**NOTA 1:** Recuerde que en la prueba Shapiro-Wilk, la hipótesis nula consiste en que los datos de un grupo dado provienen de una distribución Normal. Por lo tanto, si el p-value es grande $(p>0.05)$, NO es posible rechazar la hipótesis nula, es decir, los datos siguen una distribución Normal.

**NOTA 2:** Recuerde que en la prueba t, La hipótesis nula consiste en asumir que NO hay diferencia estadísticamente significativa entre las medias de los dos grupos. Por lo tanto, si el p-value es pequeño $(p < 0.05)$ se puede rechazar la hipótesis nula, es decir, SÍ hay una diferencia significativa entre los grupos (las medias).

**NOTA 1:** Recuerde que en la prueba U de Mann-Withney, la hipótesis nula es que NO hay diferencia estadísticamente significativa entre las medianas de las distribuciones ajustadas de los dos grupos. Por lo tanto, un p-value pequeño $(p < 0.05)$ permite rechazar la hipótesis nula. Es decir, permite decir que SÍ hay diferencia significativa entre los dos grupos (las medianas).
