
# **Estadística II – División Ortiz - CFC**

*Daniela Agostina Gonzalez*

# Estimación por intervalos

In [1]:
# Librerías

import numpy as np
import scipy.stats as stats
import math

## Estimación para la media con varianza poblacional conocida

Población normal: $X \sim N(\mu, \sigma)$

$LIC = \bar{X} -z \frac{\sigma}{\sqrt{n}}$

$LSC = \bar{X} +z \frac{\sigma}{\sqrt{n}}$

Si la distribución de la población es deconocida, también usamos la distribución normal si:



*   $n\geq 30, \sigma$ conocida
*   $n \geq 100, \sigma$ desconocida



### Ejemplo

El equipo de investigación de una empresa está analizando el ciclo de vida de una nueva batería desarrollada para uno de sus productos.

Por experiencia de otros desarrollos, se sabe que el ciclo de vida de las baterías tiene una distribución aproximadamente normal con una desviación estándar de de 500 horas.

En base a una muestra de 15 baterías, se estimó que el ciclo de vida medio es 8900 horas.


In [None]:
# Parámetros conocidos
media_muestral = 8900  # Media de la muestra
n = 15  # Tamaño de la muestra
sigma = 500  # Desviación estándar poblacional conocida
nivel_confianza = 0.95  # Nivel de confianza deseado


In [None]:
# Calcular el error estándar
error_estandar = sigma / np.sqrt(n)


In [None]:
# Calcular el valor crítico z
z_critico = stats.norm.ppf((1 + nivel_confianza) / 2)


In [None]:
# Calcular el intervalo de confianza

LIC = media_muestral - z_critico * error_estandar
LSC = media_muestral + z_critico * error_estandar
intervalo_confianza = (LIC, LSC)

intervalo_confianza


(8646.969737623667, 9153.030262376333)

## Estimación para la media con varianza poblacional desconocida

Intervalo de confianza del 95% para la media de la población, con 𝞂 desconocido. Se estima que la desviación estándar es $s = 490$

In [None]:
# Parámetros conocidos
media_muestral = 8900  # Media de la muestra
n = 15  # Tamaño de la muestra
desviacion_estandar_muestral = 490 # Desviación estándar
nivel_confianza = 0.95  # Nivel de confianza


# Calcular el error estándar
error_estandar = desviacion_estandar_muestral / np.sqrt(n)

# Calcular el valor crítico t
t_critico = stats.t.ppf((1 + nivel_confianza) / 2, df=n-1)

# Calcular el intervalo de confianza

LIC = media_muestral - t_critico * error_estandar
LSC = media_muestral + t_critico * error_estandar

intervalo_confianza = (LIC, LSC)

intervalo_confianza


(8628.647044633326, 9171.352955366674)

## Estimación para la varianza

$LIC = \frac{(n-1)S^2}{\chi^2_{n-1,-\frac{\alpha}{2}}} \quad LSC = \frac{(n-1)S^2}{\chi^2_{n-1,\frac{\alpha}{2}}}$

### Ejemplo


El equipo de investigación de una empresa está analizando el ciclo de vida de una nueva batería desarrollada para uno de sus productos.

Por experiencia de otros desarrollos, se sabe que el ciclo de vida de las baterías tiene una distribución aproximadamente normal. En base a una muestra de 15 baterías, estimó que la media de la vida es de 8900 y la varianza $s^2=240100$ $horas^2$

In [None]:
# Información
media_muestral = 8900  # Media de la muestra
n = 15  # Tamaño de la muestra
varianza_muestral = 240100
nivel_confianza = 0.95  # Nivel de confianza




In [None]:
# Calcular los valores críticos chi-cuadrado
chi2_critico_inferior = stats.chi2.ppf((1 - nivel_confianza) / 2, df=n-1)
chi2_critico_superior = stats.chi2.ppf((1 + nivel_confianza) / 2, df=n-1)


In [None]:
# Calcular los límites del intervalo de confianza para la varianza
LIC = (n - 1) * varianza_muestral / chi2_critico_superior
LSC = (n - 1) * varianza_muestral / chi2_critico_inferior
intervalo_confianza = (LIC, LSC)

intervalo_confianza


(128695.84158611126, 597186.6348559244)

## Estimación para la proporción muestral

Teniendo en cuenta $np \geq 5 $ y $n(1-p) \geq 5$, empleamos la distribución normal

$LIC = \hat{p} - z \frac{\hat{p}(1-\hat{p})}{n}$

$LSC = \hat{p} + z \frac{\hat{p}(1-\hat{p})}{n}$

### Ejemplo  
Suponga que el equipo de investigación de la empresa descubre que, de 150 pilas controladas, 45 baterías tienen fallas en su rendimiento.



In [None]:
# Parámetros conocidos
n = 150  # Tamaño de la muestra
x = 45  # Número de éxitos en la muestra
nivel_confianza = 0.95  # Nivel de confianza deseado

# Calcular la proporción muestral
p_muestral = x / n
p_muestral

0.3

In [None]:
# Calcular el error estándar de la proporción
error_estandar = np.sqrt(p_muestral * (1 - p_muestral) / n)


In [None]:
# Calcular el valor crítico z
z_critico = stats.norm.ppf((1 + nivel_confianza) / 2)


In [None]:
# Calcular el intervalo de confianza

LIC = p_muestral -  z_critico * error_estandar
LSC = p_muestral +  z_critico * error_estandar
intervalo_confianza = (LIC, LSC)

intervalo_confianza

(0.22666486279434817, 0.3733351372056518)

### Determinación del tamaño de muestra para la estimación de la media poblacional y la proporción poblacional

Para la media:
\begin{equation}
n= \frac{z^2\sigma^2}{e^2}
\end{equation}

In [None]:
# Nivel de confianza
nivel_confianza = 0.95

# Desviación estándar poblacional (se asume conocida)
sigma = 10

# Margen de error deseado
e = 2


In [None]:
# Cálculo del valor crítico Z
Z = stats.norm.ppf(1 - (1 - nivel_confianza) / 2)

# Cálculo del tamaño de la muestra
n = (Z * sigma / e) ** 2

# Redondear hacia arriba para asegurar que el tamaño de la muestra sea un número entero
n = math.ceil(n)

n

97

Para la proporción:
\begin{equation}
n= \frac{z^2p(1-p)}{e^2}
\end{equation}

In [None]:
# Nivel de confianza (por ejemplo, 95%)
nivel_confianza = 0.95

# Estimación de la proporción poblacional
p = 0.5

# Margen de error deseado
e = 0.05


In [None]:
# Cálculo del valor crítico Z
Z = stats.norm.ppf(1 - (1 - nivel_confianza) / 2)

# Cálculo del tamaño de la muestra
n = (Z ** 2 * p * (1 - p)) / e ** 2

# Redondear hacia arriba para asegurar que el tamaño de la muestra sea un número entero
n = math.ceil(n)
n

385

Para la media, con error relativo:
\begin{equation}
n= \frac{z^2CV^2}{e^2}
\end{equation}

In [2]:
# Nivel de confianza
nivel_confianza = 0.95

# Coeficiente de variación (desviación estándar dividido por la media)
CV = 0.1

# Margen de error relativo deseado
e = 0.05



In [5]:
# Cálculo del valor crítico Z
Z = stats.norm.ppf(1 - (1 - nivel_confianza) / 2)

# Cálculo del tamaño de la muestra
n = (Z * CV / e) ** 2

# Redondear hacia arriba para asegurar que el tamaño de la muestra sea un número entero
n = math.ceil(n)
n

16

Para la proporción, con error relativo:
\begin{equation}
n= \frac{z^2p(1-p)}{e^2p^2}
\end{equation}

In [7]:
# Nivel de confianza
nivel_confianza = 0.95

# Estimación de la proporción poblacional
p = 0.5

# Margen de error relativo deseado
e = 0.05  # Cambia esto por el margen de error relativo deseado



In [8]:
# Cálculo del valor crítico Z
Z = stats.norm.ppf(1 - (1 - nivel_confianza) / 2)

# Cálculo del error absoluto a partir del error relativo
E_absoluto = e * p

# Cálculo del tamaño de la muestra
n = (Z ** 2 * p * (1 - p)) / E_absoluto ** 2

# Redondear hacia arriba para asegurar que el tamaño de la muestra sea un número entero
n = math.ceil(n)
n

1537