<a href="https://colab.research.google.com/github/victorhugohh35/Simulacion-II/blob/main/Pruebadeuniformidad.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Prueba de uniformidad $\chi^2$

En general, la prueba chi-cuadrada busca determinar si los números del conjunto $t_i$ se distribuyen de manera uniforme en el intervalo (0,1). Para llevar a cabo esta prueba es necesario dividir el intervalo (0,1) en n sub-intervalos(clases),es recomendable usar $n=\sqrt T$ donde $T$ es el númeron total de observaciones o datos. Luego se clasifica cada número del conjunto $t$ en las $n$ clases. A la cantidad de números $t_i$  que se clasifican en cada clase se le denomina frecuencia observada $O_i$, y a la cantidad de números $t_i$ que se espera encontrar en cada intervalo se le llama frecuencia esperada $E_i$ ; teóricamente, la $E_i$ es igual a $E_i=\frac{T}{n}$. A partir de los valores de $O_i$ y $E_i$, se determina el estadístico $\chi^2$ mediante la ecuación:
\begin{equation}
\chi^2_c = \sum_{i=1}^{n} \frac{(O_i - E_i)^2}{E_i}
\end{equation}
Si el valor estadistico $\chi^2_c$ es menor al de tablas de $\chi^2_{1-\alpha,n-1}$ donde $n-1$ son los grados de libertad y $1-\alpha$ el nivel de aceptación, entonces no se puede rechazar la $H_0$: No hay diferencia entre el conjunto de datos $t_i$ y la  distribución uniforme(0,1).

**Implementamos el método anteriormente descrito en Python.**


Copiamos los a datos a los cuales queremos aplicar la prueba, y pedimos al usuario ingresar el nivel de aceptación que requiera.

In [5]:
#Prueba de uniformidad (0,1) chi-cuadrada
#Victor Hugo Hernandez Hernandez

from scipy.stats import chi2
import math
#datos problema 3
#datos = [38, 33, 25, 5, 69, 35, 98, 52, 12, 79,
#        50, 46, 95, 42, 49, 11, 78, 34, 2, 43,
#        7, 50, 5, 91, 77, 18, 21, 4, 17, 62,
#        91, 36, 48, 88, 52, 76, 99, 73, 82, 90]
#datos problema 4
datos = [0.8797, 0.3884, 0.6289, 0.8750, 0.5999, 0.8589, 0.9996, 0.2415, 0.3808, 0.9606,
        0.9848, 0.3469, 0.7977, 0.5844, 0.8147, 0.6431, 0.7387, 0.5613, 0.0318, 0.7401,
        0.4557, 0.1592, 0.8536, 0.8846, 0.3410, 0.1492, 0.8681, 0.5291, 0.3188, 0.5992,
        0.9170, 0.2204, 0.5991, 0.5461, 0.5739, 0.3254, 0.0856, 0.2258, 0.4603, 0.5027,
        0.8376, 0.6235, 0.3681, 0.2088, 0.1525, 0.2006, 0.4720, 0.4272, 0.6360, 0.0954]
alpha = float(input("Introduce el nivel de aceptación(como porcentaje decimal):"))

Introduce el nivel de aceptación(como porcentaje decimal):0.95


Normalizamos los datos para que se encuentren en el rango de (0,1) en caso de que sea necesario.

In [6]:
#verificamos que los datos esten normalizados en (0,1)
if 0 < max(datos) < 1:
    datos_normalizados = datos
else: #si los datos no estan normalizados realizamos un ajuste
    longitud = len(str(int(max(datos)))) #longitud del numero entero maximo de los datos
    datos_normalizados = [elemento / (10**longitud) for elemento in datos] #normalizamos

Calculamos valores importantes.

In [7]:
T=len(datos) #numero total de datos
n=math.floor(math.sqrt(T))  #numero de clases recomendado
gl = n-1  # Grados de libertad que nos ayudara para la prueba final
clasediv=1/n #para asignar cada elemento de los datos a una clase, tomando en cuenta que es uniforme
chicuadrada=0 #inicializamos el valor del estadistico chi cuadrada en 0

Calculamos los valores esperados para cada clase, que en este caso al ser uniforme, es la misma para todas.

In [8]:
E = T/n #numero esperado en la clase i(uniforme)

Y ahora los valores observados para cada clase, supongamos que $clase_i=[a_i,a_{i+1}]$, el codigo verifica si cada uno de los datos se encuentra entre $[a_i,a_{i+1}]$, de ser cierto lo asigna a $clase_i$, de lo contrario continuara probando con $[a_{i+1},a_{i+2}]$, y así sucesivamente hasta quedar asignado en una clase.

In [9]:
for i in range(n):
    contador = 0
    for j in range(T):
        if (clasediv*(i))<=datos_normalizados[j]<(clasediv*(i+1)):
            contador +=1
    chicuadrada= chicuadrada + (contador-E)**2

Notemos que en la última linea se está calculando \begin{equation}
\chi^2_c = \sum_{i=1}^{n} (O_i - E_i)^2
\end{equation}
Asi que queda dividir entre $E_i$ para finalmente obtener
\begin{equation}
\chi^2_c = \sum_{i=1}^{n} \frac{(O_i - E_i)^2}{E_i}
\end{equation}

In [10]:
chicuadrada = chicuadrada/E #obtenemos el valor final del estadistico

Ahora queda calcular el valor critico, que es el que obtendriamos en las tablas de la distribución $\chi^2_{1-\alpha,n-1}$, usamos el alpha($\alpha$) ingresado por el usuario y los grados de libertad(gl) antes calculados en funcion de el número de clases(n)

In [11]:
valor_critico = chi2.ppf(alpha, gl)

Finalmente, imprimimos los resultados, de acuerdo a la $H_0$ establecida al principio.

In [12]:
##imprimimos resultados##
print("El numero de clases es: ",n)
print("El valor del estadistico es: ",chicuadrada)
print("El valor critico es: ",valor_critico)
if chicuadrada <= valor_critico:
  print("Dado que valor estadistico <= valor critico, No rechazamos  H_0, es decir no hay diferencia entre la distribución de la muestra y la distribución teórica.")
else:
  print("Dado que valor estadistico > valor critico, Rechazamos H_0,es decir los datos proporcionan suficiente evidencia para concluir que la hipótesis nula es poco probable.")

El numero de clases es:  7
El valor del estadistico es:  3.7599999999999993
El valor critico es:  12.591587243743977
Dado que valor estadistico <= valor critico, No rechazamos  H_0, es decir no hay diferencia entre la distribución de la muestra y la distribución teórica.
