# **P Value**

* El valor p (p-value) es una medida estadística que se utiliza en la prueba de hipótesis para ayudar a determinar la significación estadística de los resultados obtenidos en un experimento o estudio. Aquí tienes una explicación detallada, junto con un ejemplo práctico.

* **Concepto Clave :**
1. Hipótesis Nula : Es una afirmación que se desea probar, normalmente que no hay efecto o diferencia. Por ejemplo, "no hay diferencia en el rendimiento entre dos grupos de estudiantes".

2. Hipótesis Alternativa : Es la afirmación que se acepta si se rechaza la hipótesis nula. Por ejemplo, "hay una diferencia en el rendimiento entre dos grupos de estudiantes".

Valor p: Es la probabilidad de obtener un resultado tan extremo o más extremo que el observado, bajo la suposición de que la hipótesis nula es verdadera. Un valor p bajo sugiere que el resultado observado es poco probable bajo hipótesis nula.

* Tomar una decisión:

Si p <= alfa Rechaza la Ho. Esto sugiere evidencia suficiente para aceptar Ha

Si p > alfa No se rechaza la Ho. Esto sugiere que no hay evidencia suficiente par aceptar Ha

## **T-Test**

Se va usar cuando tienes una muestra pequeña y no conoces la desviación estandar de la población

In [18]:
from scipy.stats import ttest_1samp
import numpy as np
import numpy as np
from scipy import stats
from scipy.stats import norm
import warnings
warnings.filterwarnings('ignore')

In [16]:
# Datos de los grupos
grupo_a = np.array([85, 88, 90, 92, 87])  # Nuevo método
grupo_b = np.array([80, 82, 78, 79, 81])  # Método tradicional

# Realizar un T-test
t_statistic,p_value=stats.ttest_ind(grupo_a, grupo_b)

# Imprimir Resultados
print(f"Estadístico t: {t_statistic:.4f}")
print(f"Valor p: {p_value:.4f}")


Estadístico t: 6.0000
Valor p: 0.0003


In [3]:
# Nivel de significancia
alpha = 0.05

# Tomar decisión
if p_value <= alpha:
    print("Rechazamos la hipótesis nula (H0). Hay evidencia suficiente para afirmar que el nuevo método mejora el rendimiento.")
else:
    print("No rechazamos la hipótesis nula (H0). No hay evidencia suficiente para afirmar que el nuevo método mejora el rendimiento.")

Rechazamos la hipótesis nula (H0). Hay evidencia suficiente para afirmar que el nuevo método mejora el rendimiento.


## **Z-Test**

* Cuando tienes una muestra grande n>30 o conoces la desviacion estandar de la población.




* Ejemplo 
Supón que trabajas en una empresa que produce bombillas y quieres verificar si una nueva línea de bombillas tiene una duración media de vida útil diferente a la de la producción estándar, que tiene una media conocida de 1000 horas con una desviación estándar poblacional de 100 horas.

In [4]:
# Datos del problema
mu = 1000  # Media poblacional
sigma = 100  # Desviación estándar poblacional
n = 50  # Tamaño de la muestra
x_bar = 980  # Media muestral

# Calculo del estadístico Z
z_statistic=(x_bar - mu) / (sigma / np.sqrt(n))

# Cálculo del valor p (dos colas)
p_value = stats.norm.sf(abs(z_statistic)) * 2 

# Imprimir resultados
print(f"Estadístico Z: {z_statistic:.4f}")
print(f"Valor p: {p_value:.4f}")

# Decisión
alpha = 0.05
if p_value <= alpha:
    print("Rechazamos la hipótesis nula. La nueva línea de bombillas tiene una duración media diferente a 1000 horas.")
else:
    print("No rechazamos la hipótesis nula. No hay evidencia suficiente para decir que la duración media es diferente a 1000 horas.")

Estadístico Z: -1.4142
Valor p: 0.1573
No rechazamos la hipótesis nula. No hay evidencia suficiente para decir que la duración media es diferente a 1000 horas.


* Ejercicio 1

Una asociación de hosteleros rurales desea conocer la edad media de los turistas que optan por
los alojamientos rurales durante el período estival. Un estudio realizado tres años antes indicaba
que esta edad se situaba en los 39 años. Sin embargo, para planificar la campaña turística de este
año, se realiza un nuevo estudio seleccionando una muestra de 850 individuos que desean viajar
durante sus vacaciones, resultando que la edad media de los que planean pernoctar en
alojamientos rurales es de 40,7 años. Sabiendo que la desviación típica de ese estudio fue de 4,8
años, y con un nivel de confianza del 95%, ¿se puede concluir que la edad media de los
visitantes ha aumentado en los tres últimos años?

* La hipótesis nula Ho: µ =39 : Plantea que la edad media de los turistas no ha cambiado respecto al estudio anterior de hace unos años, por eso establece la igualdad respecto a la edad que indicaba aquel estudio.

* La hipótesis alternativa H1: µ >39 Plantea entonces que la edad media es mayor a 39 años.

In [45]:
# Datos del problema
mu = 39  # Media poblacional
sigma = 4.8  # Desviación estándar poblacional
n = 850  # Tamaño de la muestra
x_bar = 40.7  # Media muestral


# Calculo del estadístico Z
z_statistic=(x_bar - mu) / (sigma / np.sqrt(n))

# Nivel de significación (alpha)
alpha = 0.05

# Nivel de confianza (1 - alpha)
nivel_confianza = 1 - alpha

# Valor de Z unilateral
z_valor = norm.ppf(alpha)

# Imprimir resultados
print(f"Estadístico Z: {z_statistic:.4f}")
print(f"Valor de Z: {z_valor:.4f}")

Estadístico Z: 10.3256
Valor de Z: -1.6449


In [46]:
# Decisión
if abs(z_statistic) >= abs(z_valor):
    print("Rechazamos la hipótesis nula.")
else:
    print("No rechazamos la hipótesis nula.")

Rechazamos la hipótesis nula.


Concluimos que existen evidencias estadísticamente significativas para afirmar, con un nivel de
confianza del 95% que la edad media de las personas que optan por los alojamientos rurales ha
aumentado en el período considerado.

* Ejercicio 2

En la red de centros de menores de determinada región se quiere comprobar si para determinado
colectivo el promedio de intentos de fuga por interno es mayor a 3. Se selecciona aleatoriamente
a 20 menores, obteniendo que el nº medio de intentos es 3,5, con una deviación típica de 2,7.
Para un nivel de confianza del 99%, ¿puede considerarse que efectivamente el promedio de
intentos de fuga es mayor al valor que se planteaba inicialmente?

* Ho: µ =3
* H1: µ >3

La hipótesis nula mantiene que el promedio de intentos se mantiene en 3, mientras que la
hipótesis alternativa plantea, tal como se sospecha, que esa cantidad ha aumentado. Tenemos
entonces un contraste de hipótesis unilateral. 

In [20]:
# Datos
n = 20  # Tamaño de la muestra
x_bar = 3.5  # Promedio de intentos de fuga
sigma = 2.7  # Desviación típica
mu = 3  # Valor de referencia

# Prueba de hipótesis

# Calculo del estadístico Z
t_statistic=(x_bar - mu) / (sigma / np.sqrt(n-1))

# Nivel de significación
alpha = 0.01

# Valor crítico de t
grados_libertad = n - 1
# Cálculo del valor crítico t (unilateral)
t_critico = stats.t.ppf(1 - alpha, grados_libertad)

print(f"t-statística: {t_statistic:.4f}")
print(f"t-crítico: {t_critico:.4f}")

# Comparación
if np.abs(t_statistic) > t_critico:
    print("Rechazamos la hipótesis nula. El promedio de intentos de fuga es significativamente mayor a 3.")
else:
    print("No rechazamos la hipótesis nula. No hay evidencia estadística suficiente para concluir que el promedio de intentos de fuga sea mayor a 3.")


t-statística: 0.8072
t-crítico: 2.5395
No rechazamos la hipótesis nula. No hay evidencia estadística suficiente para concluir que el promedio de intentos de fuga sea mayor a 3.


Ejercicio 3

En una encuesta del CIS (diciembre de 2014) se observa que la proporción de españoles que
leen semanal o diariamente es del 45,4%, una proporción menor a la que señalaba en 2012 la
Federación de Gremios de Editores de España (47,2%). Sabiendo que la encuesta ha sido
respondida por 2.477 individuos, ¿se puede considerar significativo este descenso en la
proporción de lectores habituales para un nivel de significación de 0,01?


* Ho: µ = 47.2
* H1: µ < 47.2

In [41]:
# Datos del problema
mu = 0.472  # Media poblacional
#sigma = 4.8  # Desviación estándar poblacional
n = 2477  # Tamaño de la muestra
x_bar = 0.454  # Media muestral


# Calculo del estadístico Z
z_statistic=(x_bar - mu) / (np.sqrt(mu*(1-mu)/n))

# Nivel de significación (alpha)
alpha = 0.01

# Nivel de confianza (1 - alpha)
#nivel_confianza = 1 - alpha

# Valor de Z unilateral
z_valor = norm.ppf(alpha)

# Imprimir resultados
print(f"Estadístico Z: {z_statistic:.4f}")
print(f"Valor de Z: {z_valor:.4f}")

Estadístico Z: -1.7945
Valor de Z: -2.3263


In [42]:
# Decisión
if abs(z_statistic) >= abs(z_valor):
    print("Rechazamos la hipótesis nula.")
else:
    print("No rechazamos la hipótesis nula.")

No rechazamos la hipótesis nula.


* Conclusiones

Para un nivel de confianza del 99% concluimos que no hay evidencias estadísticamente
significativas para rechazar la hipótesis nula (H0). No podemos afirmar que para ese nivel de
confianza haya disminuido significativamente la proporción de españoles que leen diaria o
semanalmente.

Ejercicio 4

Según una encuesta sobre consumo de drogas realizada en 2015, el 9,1% de la población
española había consumido cocaína alguna vez en su vida. En un estudio realizado en 2013,
dicha proporción era del 10,3%. Suponiendo que la encuesta se realizó a 2.200 individuos, se
desea saber:

a) Para un nivel de confianza del 95% si el descenso en el consumo de cocaína es significativo.

b) ¿Cuál es y qué significa el p-valor del contraste?

* Ho: µ = 0.103
* H1: µ < 0.103

In [43]:
# Datos del problema
mu = 0.103  # Media poblacional
#sigma = 4.8  # Desviación estándar poblacional
n = 2200  # Tamaño de la muestra
x_bar = 0.091  # Media muestral 


# Calculo del estadístico Z
z_statistic=(x_bar - mu) / (np.sqrt((mu*(1-mu))/n))

# Nivel de significación (alpha)
alpha = 0.05

# Cálculo del valor crítico Z (unilateral)
z_valor = norm.ppf(alpha)

# Imprimir resultados
print(f"Estadístico Z: {z_statistic:.4f}")
print(f"Valor de Z: {z_valor:.4f}")

Estadístico Z: -1.8517
Valor de Z: -1.6449


In [44]:
# Decisión
if abs(z_statistic) >= abs(z_valor):
    print("Rechazamos la hipótesis nula.")
else:
    print("No rechazamos la hipótesis nula.")

Rechazamos la hipótesis nula.


* Podemos afirmar para un nivel de confianza del 95% que la cantidad de españoles que han consumido cocaína alguna vez en su vida ha descendido respecto al 2013

## **Pruebas de Hipotesis**

![Pregunta1](Pregunta%201.png)


In [47]:
# Datos del problema
mu = 20  # Media poblacional
sigma = 2.5  # Desviación estándar poblacional
n = 40  # Tamaño de la muestra
x_bar = 19.3  # Media muestral


# Calculo del estadístico Z
z_statistic=(x_bar - mu) / (sigma / np.sqrt(n))

# Nivel de significación (alpha)
alpha = 0.05

# Nivel de confianza (1 - alpha)
nivel_confianza = 1 - alpha

# Valor de Z unilateral
z_valor = norm.ppf(alpha)

# Imprimir resultados
print(f"Estadístico Z: {z_statistic:.4f}")
print(f"Valor de Z: {z_valor:.4f}")

Estadístico Z: -1.7709
Valor de Z: -1.6449


In [48]:
# Decisión
if abs(z_statistic) >= abs(z_valor):
    print("Rechazamos la hipótesis nula.")
else:
    print("No rechazamos la hipótesis nula.")

Rechazamos la hipótesis nula.


Concluimos que existen evidencias estadísticamente significativas para afirmar, con un nivel de
confianza del 95% que el peso del pan es menor a los 20 gramos. 
Entonces la multa esta bien aplicada

![Pregunta2](Pregunta%202.png)

* Ho: µ = < 50
* H1: µ > 50

In [51]:
# Datos del problema
mu = 50  # Media poblacional
sigma = 3  # Desviación estándar poblacional
n = 64  # Tamaño de la muestra
x_bar = 50.5  # Media muestral


# Calculo del estadístico Z
z_statistic=(x_bar - mu) / (sigma / np.sqrt(n))

# Nivel de significación (alpha)
alpha = 0.05

# Nivel de confianza (1 - alpha)
nivel_confianza = 1 - alpha

# Valor de Z unilateral
z_valor = norm.ppf(alpha)

# Imprimir resultados
print(f"Estadístico Z: {z_statistic:.4f}")
print(f"Valor de Z: {z_valor:.4f}")

Estadístico Z: 1.3333
Valor de Z: -1.6449


In [52]:
# Decisión
if abs(z_statistic) >= abs(z_valor):
    print("Rechazamos la hipótesis nula.")
else:
    print("No rechazamos la hipótesis nula.")

No rechazamos la hipótesis nula.


* En conclusión se debe rechazar el lote, ya que presenta una vida de 50.5 horas en promedio

![Pregunta1](Pregunta%203.png)

* ho = 18

* ha < 18

In [55]:
# Datos del problema
mu = 18  # Media poblacional
sigma = 2  # Desviación estándar poblacional
n = 16  # Tamaño de la muestra
x_bar = 17  # Media muestral

# Prueba de hipótesis

# Calculo del estadístico Z
t_statistic=(x_bar - mu) / (sigma / np.sqrt(n-1))

# Nivel de significación
alpha = 0.05

# Valor crítico de t
grados_libertad = n - 1
# Cálculo del valor crítico t (unilateral)
t_critico = stats.t.ppf(1 - alpha, grados_libertad)

print(f"t-statística: {t_statistic:.4f}")
print(f"t-crítico: {t_critico:.4f}")

# Comparación
if np.abs(t_statistic) > t_critico:
    print("Rechazamos la hipótesis nula.")
else:
    print("No rechazamos la hipótesis nula.")


t-statística: -1.9365
t-crítico: 1.7531
Rechazamos la hipótesis nula.


Conclusion Rechazamos la hipotesis nula y no aceptamos que la hipotesis de la media es igual a 18