In [1]:
import scipy.stats as stats
import numpy as np

Algunos links para leer documentación:
* https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_1samp.html
* https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.t.html

# Ejercicio 16

Según el Código Alimentario Argentino (CAA) un alimento es considerado bajo en sodio si el mismo posee a lo sumo 120 mg de sodio por cada 100 g de producto. Se tomaron 16 muestras aleatoriamente elegidas de galletas rotuladas como bajas en sodio de cierta marca, con el fin de determinar el cumplimiento de las normas alimentarias del CAA. Los contenidos de sodio (mg) por cada 100 g de muestra de galletas
fueron:

$$ 125.02 \hspace{0.5 cm} 121.45  \hspace{0.5 cm} 122.25 \hspace{0.5 cm} 119.37 \hspace{0.5 cm} 120.80 \hspace{0.5 cm} 124.78 \hspace{0.5 cm} 121.35 \hspace{0.5 cm} 124.97$$
$$ 119.98 \hspace{0.5 cm} 117.50 \hspace{0.5 cm} 121.13 \hspace{0.5 cm} 123.09 \hspace{0.5 cm} 124.40 \hspace{0.5 cm} 126.97 \hspace{0.5 cm} 118.89 \hspace{0.5 cm} 121.72$$
Suponga que el contenido de sodio tiene distribución normal. ¿Esta información sugiere que esta marca de galletas no está cumpliendo las normas alimentarias del CAA? Plantear las hipótesis de interés y concluir usando un nivel de significancia de 0,05

In [2]:
data_galletas = [125.02,121.45,122.25,119.37,120.80,124.78,121.35,124.97,119.98,117.50,121.13,123.09,124.40,126.97,118.89,121.72]

In [8]:
# Hipótesis nula: La media de la población es menor o igual a 120.
# Hipótesis alternativa: La media de la población es mayor a 120.

alpha = 0.05

# Realizar la prueba t de Student
t_statistic, p_value = stats.ttest_1samp(data_galletas, 120, alternative='greater')

# Comparar el valor p con el nivel de significancia
if p_value < alpha:
    print("Rechazamos la hipótesis nula")
else:
    print("No podemos rechazar la hipótesis nula")

# Imprimir valores importantes
print("t: ",t_statistic)
print("grados de libertad: ", len(data_galletas)-1)
print("p-valor: ", p_value)

Rechazamos la hipótesis nula
t:  3.241873504700259
grados de libertad:  15
p-valor:  0.002736847041442645


### Otra forma

In [4]:
# Se crea un arreglo de numpy que contiene los valores de sodio que se desean analizar.
sodio = np.array([125.02, 121.45, 122.25, 119.37, 120.80, 124.78, 121.35, 124.97, 119.98, 117.50, 121.13, 123.09, 124.40, 126.97, 118.89, 121.72])
# calcula la prueba t de una muestra en el arreglo "sodio" con una hipótesis nula de que la media es igual a 120. La opción alternative='greater'
# indica que estamos interesados en probar si la verdadera media es mayor que 120.
t_stat, p_value = stats.ttest_1samp(sodio, 120, alternative='greater')

# Imprime el encabezado "One Sample t-test" para indicar el tipo de prueba que se realizó.
print("One Sample t-test")
# Imprime el valor de t, que es una medida de cuántas desviaciones estándar está la media de la muestra con respecto a la hipótesis nula.
# Imprime los grados de libertad (df), que son el número de observaciones menos 1.
# Imprime el valor p, que es la probabilidad de obtener el resultado observado si la hipótesis nula es cierta. En este caso, estamos
# interesados en el valor p para la hipótesis alternativa "mayor que".
print(f"t = {t_stat:.4f}, df = {len(sodio) - 1}, p-value = {p_value:.6f}")
# Imprime la hipótesis alternativa que indica que la verdadera media es mayor que 120.
print("alternative hypothesis: true mean is greater than 120")
# Imprime el intervalo de confianza del 95%, que muestra el valor promedio de "sodio" y "Inf" para indicar que no se ha calculado un límite superior.
print(f"95 percent confidence interval: {np.mean(sodio):.4f} Inf")
# Imprime la estimación de la media de la muestra.
print("sample estimates:")
print(f"mean of x {np.mean(sodio):.4f}")

One Sample t-test
t = 3.2419, df = 15, p-value = 0.002737
alternative hypothesis: true mean is greater than 120
95 percent confidence interval: 122.1044 Inf
sample estimates:
mean of x 122.1044


# Ejercicio 17

Para chequear las lecturas de detectores de radón de cierto tipo, se seleccionó una muestra de 12 detectores y cada uno se expuso a 100 pCi/L de radón. Las lecturas obtenidas fueron las siguientes:
$$105.6 \hspace{0.5 cm} 90.0\hspace{0.5 cm}91.2\hspace{0.5 cm}96.9\hspace{0.5 cm}96.5\hspace{0.5 cm}91.3$$
$$100.1\hspace{0.5 cm}105.0\hspace{0.5 cm}99.6\hspace{0.5 cm}107.7\hspace{0.5 cm}103.3\hspace{0.5 cm}92.4$$

(A)  ¿Estos datos indican que la lectura de radón media difiere del valor al que fueron expuestos los detectores? Plantee las hipótesis de interés, indique cuál es el valor observado del estadístico de prueba y concluya utilizando un nivel de significancia de 0,02.

(B) Obtenga un intervalo de 98\% de confianza para la lectura media de radón de los detectores de este tipo y concluya respecto a las hipótesis de interés. Compare con lo obtenido en (A).

(C) ¿Qué supuestos se necesitan para que las conclusiones obtenidas en (A) y (B) sean válidas?

In [10]:
# Lecturas de los detectores
lecturas = [105.6, 90, 91.2, 96.9, 91.3, 100.1, 105, 99.6, 107.7, 103.3, 92.4]

In [11]:
# Valor al que fueron expuestos los detectores
valor_expuesto = 100

# Hipótesis nula: La media de la población es igual a 100, el valor_expuesto.
# Hipótesis alternativa: La media de la población no es igual a 100.

# Realizamos el t-test de dos colas
t_stat, p_value = stats.ttest_1samp(lecturas, valor_expuesto)

# Nivel de significancia
nivel_significancia = 0.02

# Comparar el valor observado del estadístico de prueba con el valor crítico
if p_value < nivel_significancia:
    print("Rechazamos la hipótesis nula.")
else:
    print("No podemos rechazar la hipótesis nula.")

No podemos rechazar la hipótesis nula.


In [12]:
# Calculamos el intervalo de confianza del 98%
confianza = 0.98
intervalo = stats.t.interval(confianza, len(lecturas) - 1, loc=np.mean(lecturas), scale=stats.sem(lecturas))

print("Intervalo de confianza del 98%:", intervalo)

Intervalo de confianza del 98%: (93.05518306031212, 103.87208966696065)
