
# **Estad√≠stica II ‚Äì Divisi√≥n Ortiz - CFC**

*Daniela Agostina Gonzalez*

# Estimaci√≥n por intervalos

In [1]:
# Librer√≠as

import numpy as np
import scipy.stats as stats
import math

## Estimaci√≥n para la media con varianza poblacional conocida

Poblaci√≥n normal: $X \sim N(\mu, \sigma)$

$LIC = \bar{X} -z \frac{\sigma}{\sqrt{n}}$

$LSC = \bar{X} +z \frac{\sigma}{\sqrt{n}}$

Si la distribuci√≥n de la poblaci√≥n es deconocida, tambi√©n usamos la distribuci√≥n normal si:



*   $n\geq 30, \sigma$ conocida
*   $n \geq 100, \sigma$ desconocida



### Ejemplo

El equipo de investigaci√≥n de una empresa est√° analizando el ciclo de vida de una nueva bater√≠a desarrollada para uno de sus productos.

Por experiencia de otros desarrollos, se sabe que el ciclo de vida de las bater√≠as tiene una distribuci√≥n aproximadamente normal con una desviaci√≥n est√°ndar de de 500 horas.

En base a una muestra de 15 bater√≠as, se estim√≥ que el ciclo de vida medio es 8900 horas.


In [None]:
# Par√°metros conocidos
media_muestral = 8900  # Media de la muestra
n = 15  # Tama√±o de la muestra
sigma = 500  # Desviaci√≥n est√°ndar poblacional conocida
nivel_confianza = 0.95  # Nivel de confianza deseado


In [None]:
# Calcular el error est√°ndar
error_estandar = sigma / np.sqrt(n)


In [None]:
# Calcular el valor cr√≠tico z
z_critico = stats.norm.ppf((1 + nivel_confianza) / 2)


In [None]:
# Calcular el intervalo de confianza

LIC = media_muestral - z_critico * error_estandar
LSC = media_muestral + z_critico * error_estandar
intervalo_confianza = (LIC, LSC)

intervalo_confianza


(8646.969737623667, 9153.030262376333)

## Estimaci√≥n para la media con varianza poblacional desconocida

Intervalo de confianza del 95% para la media de la poblaci√≥n, con ùûÇ desconocido. Se estima que la desviaci√≥n est√°ndar es $s = 490$

In [None]:
# Par√°metros conocidos
media_muestral = 8900  # Media de la muestra
n = 15  # Tama√±o de la muestra
desviacion_estandar_muestral = 490 # Desviaci√≥n est√°ndar
nivel_confianza = 0.95  # Nivel de confianza


# Calcular el error est√°ndar
error_estandar = desviacion_estandar_muestral / np.sqrt(n)

# Calcular el valor cr√≠tico t
t_critico = stats.t.ppf((1 + nivel_confianza) / 2, df=n-1)

# Calcular el intervalo de confianza

LIC = media_muestral - t_critico * error_estandar
LSC = media_muestral + t_critico * error_estandar

intervalo_confianza = (LIC, LSC)

intervalo_confianza


(8628.647044633326, 9171.352955366674)

## Estimaci√≥n para la varianza

$LIC = \frac{(n-1)S^2}{\chi^2_{n-1,-\frac{\alpha}{2}}} \quad LSC = \frac{(n-1)S^2}{\chi^2_{n-1,\frac{\alpha}{2}}}$

### Ejemplo


El equipo de investigaci√≥n de una empresa est√° analizando el ciclo de vida de una nueva bater√≠a desarrollada para uno de sus productos.

Por experiencia de otros desarrollos, se sabe que el ciclo de vida de las bater√≠as tiene una distribuci√≥n aproximadamente normal. En base a una muestra de 15 bater√≠as, estim√≥ que la media de la vida es de 8900 y la varianza $s^2=240100$ $horas^2$

In [None]:
# Informaci√≥n
media_muestral = 8900  # Media de la muestra
n = 15  # Tama√±o de la muestra
varianza_muestral = 240100
nivel_confianza = 0.95  # Nivel de confianza




In [None]:
# Calcular los valores cr√≠ticos chi-cuadrado
chi2_critico_inferior = stats.chi2.ppf((1 - nivel_confianza) / 2, df=n-1)
chi2_critico_superior = stats.chi2.ppf((1 + nivel_confianza) / 2, df=n-1)


In [None]:
# Calcular los l√≠mites del intervalo de confianza para la varianza
LIC = (n - 1) * varianza_muestral / chi2_critico_superior
LSC = (n - 1) * varianza_muestral / chi2_critico_inferior
intervalo_confianza = (LIC, LSC)

intervalo_confianza


(128695.84158611126, 597186.6348559244)

## Estimaci√≥n para la proporci√≥n muestral

Teniendo en cuenta $np \geq 5 $ y $n(1-p) \geq 5$, empleamos la distribuci√≥n normal

$LIC = \hat{p} - z \frac{\hat{p}(1-\hat{p})}{n}$

$LSC = \hat{p} + z \frac{\hat{p}(1-\hat{p})}{n}$

### Ejemplo  
Suponga que el equipo de investigaci√≥n de la empresa descubre que, de 150 pilas controladas, 45 bater√≠as tienen fallas en su rendimiento.



In [None]:
# Par√°metros conocidos
n = 150  # Tama√±o de la muestra
x = 45  # N√∫mero de √©xitos en la muestra
nivel_confianza = 0.95  # Nivel de confianza deseado

# Calcular la proporci√≥n muestral
p_muestral = x / n
p_muestral

0.3

In [None]:
# Calcular el error est√°ndar de la proporci√≥n
error_estandar = np.sqrt(p_muestral * (1 - p_muestral) / n)


In [None]:
# Calcular el valor cr√≠tico z
z_critico = stats.norm.ppf((1 + nivel_confianza) / 2)


In [None]:
# Calcular el intervalo de confianza

LIC = p_muestral -  z_critico * error_estandar
LSC = p_muestral +  z_critico * error_estandar
intervalo_confianza = (LIC, LSC)

intervalo_confianza

(0.22666486279434817, 0.3733351372056518)

### Determinaci√≥n del tama√±o de muestra para la estimaci√≥n de la media poblacional y la proporci√≥n poblacional

Para la media:
\begin{equation}
n= \frac{z^2\sigma^2}{e^2}
\end{equation}

In [None]:
# Nivel de confianza
nivel_confianza = 0.95

# Desviaci√≥n est√°ndar poblacional (se asume conocida)
sigma = 10

# Margen de error deseado
e = 2


In [None]:
# C√°lculo del valor cr√≠tico Z
Z = stats.norm.ppf(1 - (1 - nivel_confianza) / 2)

# C√°lculo del tama√±o de la muestra
n = (Z * sigma / e) ** 2

# Redondear hacia arriba para asegurar que el tama√±o de la muestra sea un n√∫mero entero
n = math.ceil(n)

n

97

Para la proporci√≥n:
\begin{equation}
n= \frac{z^2p(1-p)}{e^2}
\end{equation}

In [None]:
# Nivel de confianza (por ejemplo, 95%)
nivel_confianza = 0.95

# Estimaci√≥n de la proporci√≥n poblacional
p = 0.5

# Margen de error deseado
e = 0.05


In [None]:
# C√°lculo del valor cr√≠tico Z
Z = stats.norm.ppf(1 - (1 - nivel_confianza) / 2)

# C√°lculo del tama√±o de la muestra
n = (Z ** 2 * p * (1 - p)) / e ** 2

# Redondear hacia arriba para asegurar que el tama√±o de la muestra sea un n√∫mero entero
n = math.ceil(n)
n

385

Para la media, con error relativo:
\begin{equation}
n= \frac{z^2CV^2}{e^2}
\end{equation}

In [2]:
# Nivel de confianza
nivel_confianza = 0.95

# Coeficiente de variaci√≥n (desviaci√≥n est√°ndar dividido por la media)
CV = 0.1

# Margen de error relativo deseado
e = 0.05



In [5]:
# C√°lculo del valor cr√≠tico Z
Z = stats.norm.ppf(1 - (1 - nivel_confianza) / 2)

# C√°lculo del tama√±o de la muestra
n = (Z * CV / e) ** 2

# Redondear hacia arriba para asegurar que el tama√±o de la muestra sea un n√∫mero entero
n = math.ceil(n)
n

16

Para la proporci√≥n, con error relativo:
\begin{equation}
n= \frac{z^2p(1-p)}{e^2p^2}
\end{equation}

In [7]:
# Nivel de confianza
nivel_confianza = 0.95

# Estimaci√≥n de la proporci√≥n poblacional
p = 0.5

# Margen de error relativo deseado
e = 0.05  # Cambia esto por el margen de error relativo deseado



In [8]:
# C√°lculo del valor cr√≠tico Z
Z = stats.norm.ppf(1 - (1 - nivel_confianza) / 2)

# C√°lculo del error absoluto a partir del error relativo
E_absoluto = e * p

# C√°lculo del tama√±o de la muestra
n = (Z ** 2 * p * (1 - p)) / E_absoluto ** 2

# Redondear hacia arriba para asegurar que el tama√±o de la muestra sea un n√∫mero entero
n = math.ceil(n)
n

1537