<a href="https://colab.research.google.com/github/rpizarrog/simulacion/blob/main/python%20casos/Caso_10_Prueba_de_Yule.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Objetivo

Determinar e interpretar la prueba de Yule

# Descripción

* A partir de unos datos recabados y cargados se forma tabla de contingencia
* Se determina el valor de *p_prueba* (probabilidad)
* Se determina los valores a, b, c y d de la tabla de contingencia de una estructura de n * n (2 * 2).
* Se determina el valor de alfa de significacncia, normalmente al $\alpha = 0.05$.
* Se contrasta el valor de *p_prueba* contra el valor de significancia $\alpha=0.05$ y se toma la decisión de si el valor de Yule tiene un significado entre las variables.

Decisión:

$$
\text{Si } (\chi^{2} < p.valor)\text{: Hay significancia estadística}
$$

$$
\text{de lo contrario:} \text{ No hay significancia estadística}
$$


La fórmula para calcular prueba de Yule; el valor debe salir entre -1 y 1 y significa nivel de relación entre las variables:
$$
Yule = Q = \frac{a\cdot d - b\cdot c}{a\cdot d + b\cdot c}
$$

La fórmula para determinar el valor de chi cuadrada calculada para el contraste contra el valor de *p_valor* de acuerdo al valor de significancia de *alfa* y a un grado $(gl = 1)$ de libertad.

$$
Chi cuadrada = \chi^{2} = \frac{(a\cdot d-b\cdot c)^2\cdot(a+b+c+d)}{(a+b)\cdot(c+d)\cdot(a+c)\cdot(b+d)}
$$






# Desarrollo





## Cargar librerías




In [None]:
# Instalar para la sesión de este caso
!pip install scipy


In [2]:
import numpy as np
from scipy.stats import chi2_contingency

## Cargar los datos

Se recupera una encuesta sobre el estudio de dos variables.

Se hizo una encuesta y fueron seleccionadas aleatoriamente 300 personas.

Se le preguntó a su género que puede ser hombre y mujer etiquetado de la siguiente manera:
* H: Hombre
* M: Mujer
¿Cuál es su género? H: Hombre o M:Mujer

Se les preguntó si consumen alcohol hoy en día (presente) en su distintas denominaciones (cerveza, vino, tequila mezcal, bebidas preparadas, entre otros) y en cualquier cantidad, sean dosis mínimas equilabradas y saluables o ingesta de alcohol.

¿Consume alcohol? Si o No.


## Aquí la tabla de contingencia
\begin{array}{c} \hline
 &  \text{No consume} & \text{Si consume} \\ \hline
 Género&  &  \\
H: Hombre & 15 & 238 \\
M: Mujer & 11 & 46 \\ \hline
\end{array}



## Hacer pueba de Yule

In [15]:
# Crear una tabla de contingencia a partir de tus datos
tabla_de_contingencia = np.array([[15, 238], [11, 46]])  # FALSE/TRUE en función de género

print("Aquí la tabla de contingencia: ")
print("\n")
print(tabla_de_contingencia)
print("\n")


# Realizar la prueba de chi-cuadrado de independencia
chi2, p_valor, _, _ = chi2_contingency(tabla_de_contingencia)

# Calcular el coeficiente de Yule
a, b, c, d = tabla_de_contingencia.ravel()  # Extraer los valores de la tabla
Yule_coefficient = (a * d - b * c) / (a * d + b * c)

print(f'Valor de Yule: {Yule_coefficient:.2f}')
print(f'Valor de chi2: {chi2:.2f}')
print(f'Valor p_valor (chi-cuadrado): {p_valor:.4f}')


# Verificar el valor de p

# Realizar una prueba de significancia (se puede ajustar el nivel de significancia )
alfa = 0.05
print ("Hay distinción enre consumo de alcohol enre hombres y mujeres ?")
if p_valor < alfa:
    print('Existe una asociación significativa entre las variables, estadísticamente hablando.')
else:
    print('No hay evidencia de una asociación significativa entre las vaiables, estadísticamente hablando.')

Aquí la tabla de contingencia: 


[[ 15 238]
 [ 11  46]]


Valor de Yule: -0.58
Valor de chi2: 9.15
Valor p_valor (chi-cuadrado): 0.0025
Hay distinción enre consumo de alcohol enre hombres y mujeres ?
Existe una asociación significativa entre las variables, estadísticamente hablando.


## Visualización



In [None]:
# Pendiente

# Relación estudiar no estudiar aprobar no aprobar

\begin{array}{c} \hline
 &  \text{No aprobar} & \text{Aprobar} \\ \hline
 Género&  &  \\
Estudiar & 15 & 40 \\
No estudiar & 25 & 20 \\ \hline
\end{array}

In [14]:
# Crear una tabla de contingencia a partir de tus datos
tabla_de_contingencia = np.array([[15, 40], [25, 20]])  # FALSE/TRUE en función de género

print("Aquí la tabla de contingencia: ")
print("\n")
print(tabla_de_contingencia)
print("\n")

# Realizar la prueba de chi-cuadrado de independencia
chi2, p_valor, _, _ = chi2_contingency(tabla_de_contingencia)

# Calcular el coeficiente de Yule
a, b, c, d = tabla_de_contingencia.ravel()  # Extraer los valores de la tabla
Yule_coefficient = (a * d - b * c) / (a * d + b * c)

print(f'Valor de Yule: {Yule_coefficient:.2f}')
print(f'Valor de chi2: {chi2:.2f}')
print(f'Valor p_valor (chi-cuadrado): {p_valor:.4f}')


# Verificar el valor de p

# Realizar una prueba de significancia (se puede ajustar el nivel de significancia )
alfa = 0.05
print ("Estudiar o preparar, implica aprobar o no aprobar un examen ?")
if p_valor < alfa:
    print('Existe una asociación significativa entre las variables.')
else:
    print('No hay evidencia de una asociación significativa.')

Aquí la tabla de contingencia: 


[[15 40]
 [25 20]]


Valor de Yule: -0.54
Valor de chi2: 7.11
Valor p_valor (chi-cuadrado): 0.0077
Estudiar o preparar, implica aprobar o no aprobar un examen ?
Existe una asociación significativa entre las variables.


In [None]:
# Visualizar

# PEndiente

# Interpretación

El valor *p_value* en una prueba estadística, en la prueba de Yule, se utiliza para determinar si existe una relación estadísticamente significativa entre las variables categóricas que se analizza,

Para este ejercicio resultó que si hay evidencia para concluir que hay una relación significativa a la inversa entre el consumo de alcohol entre hombre y mujeres. Se observa que los hombres consumen más alcohol y estadísticamente se hizo la prumeba que así lo demuestra.