# Tarea.


## Estimador Máximo Verósimil

- Una v.a $X$, es exponencial con parámetro $\lambda >0$ si $$\mathbb{P}(X)=1-e^{-\lambda x}, x >0 $$
Calcular el EMV





---

**RESPUESTA**

$f(x) = \lambda e^{-\lambda x}$

$\Rightarrow L(x_1,x_2,...,x_n) = f(x_1)f(x_2)...f(x_n)$
$\Rightarrow L(x_1,x_2,...,x_n) = \lambda e^{-\lambda x_1}\lambda e^{-\lambda x_2}...\lambda e^{-\lambda x_n}$

$\Rightarrow L(x_1,x_2,...,x_n) = \lambda^n e^{-\lambda \sum^n_{x=1}(x_i)}$

$\Rightarrow log(\lambda^n e^{-\lambda \sum^n_{x=1}(x_i)})=log(\lambda^n) + log(e^{-\lambda \sum^n_{x=1}(x_i)})= nlog(\lambda) -\lambda  \sum^n_{x=1}(x_i)$

$\Rightarrow \frac{d}{d\lambda}=n(\frac{1}{\lambda}) - \sum^n_{x=1}(x_i)$

$\Rightarrow \frac{n}{\lambda}-\sum^n_{x=1}(x_i) = 0$

$\Rightarrow \frac{n}{\lambda} = \sum^n_{x=1}(x_i)$

$$\Rightarrow \overline{\lambda} = \frac{n}{\sum^n_{x=1}(x_i)}$$

- Supongamos que la vida útil de los focos de cierta marca se modela mediante una distribución exponencial con parámetro desconocido $\lambda$. Probamos 5 focos y encontramops que la vida útil de $2,3,1,3$ y $4$ años respectivamente. ¿Cual es el EMV para $\lambda$?




---

Como ya encontramos el EMV de una exponencial entonces solo aplicamos a los datos que tenemos

In [16]:
x = [2,3,1,3,4]
n = 5
suma = sum (x)

lamhat = n/suma
print(lamhat)

0.38461538461538464


- Suponga que se tiene una variable aleatoria discreta $X$ con densidad:
	\begin{align*}
	P(X=0)&=\frac{2}{3}\theta,\\
	P(X=1)&=\frac{1}{3}\theta,\\
	P(X=2)&=\frac{2}{3}(1-\theta),\\
	P(X=3)&=\frac{1}{3}(1-\theta)
	\end{align*}
  con $\theta\in [0,1]$. Se toman las siguientes $10$ observaciones independientes de acuerdo a la distribución dada:
  $$(3, 0, 2, 1, 3, 2, 1, 0, 2, 1).$$
  Encuentra el EMV de $\theta$.





---



In [17]:
from scipy.stats import expon
import numpy as np
import sympy # para calculo simbolico y algebraico
from sympy.abc import x,z,n

In [18]:
# Vamos a crear una variable simbolica p
t = sympy.symbols('t',positive=True)

In [33]:
f0 = (2/3)*t
f1 = (1/3)*t
f2 = (2/3)*(1-t)
f3 = (1/3)*(1-t)
J = (2*f0)*(3*f1)*(3*f2)*(2*f3) #funcion de verosimilitud
logJ = sympy.expand_log(sympy.log(J)) #log de la verosimilitud
that = sympy.solve(sympy.diff(logJ,t),t)[0] #EMV
print("El estimador de maxima verosimilitud es", that)

El estimador de maxima verosimilitud es 0.500000000000000


## Intervalos de confianza

- En una encuesta de la UP, 225 estudiantes son seleccionados al azar de los que toman cálculo y se les pregunta si cálculo es su materia favorita. 100 estudiantes responden que el cálculo es su materia favorita. Proporcione un intervalo de confianza del 95 %  para la proporción de todos los estudiantes que toman cálculo y que la consideran su materia favorita.  





---
Para el intervalo de confianza de una proporcion, utilizamos la formula
$$ p +/- \sqrt{p(1-p)/n}$$


In [39]:
import statsmodels.api as sm

In [40]:
p = 100
confidence = 0.95
n = 225

conf_int = sm.stats.proportion_confint(p, n, alpha=(1-confidence), method='normal')

print("Intervalo de confianza:", conf_int)


Intervalo de confianza: (0.37951684884617914, 0.5093720400427098)


- Los datos
	$$1, 2, 3, 4$$
  se toman a partir de una distribución normal $N(\mu,\sigma^2)$ con $\mu$ desconocida.
  1. Encuentra un intervalo de confianza al nivel de $90\%$ para $\mu$, dado que $\sigma =2$.
  

In [42]:
import numpy as np
import scipy.stats as st

In [49]:
data = [1,2,3,4]
# Tamaño de la muestra
n = len(data)

# Media muestral
mean = np.mean(data)

# Desviación estándar conocida (sigma)
sigma = 2
confidence = 0.90
# Nivel de confianza
alpha = 1-confidence
z = st.norm.ppf(1 - alpha / 2)  # Valor crítico de z

# Calcular el intervalo de confianza
margin_of_error = z * (sigma / np.sqrt(n))
conf_int = (mean - margin_of_error, mean + margin_of_error)

print("Intervalo de confianza para la media:", conf_int)


Intervalo de confianza para la media: (0.8551463730485278, 4.144853626951472)


  2. Encuentra un intervalo de confianza al nivel de $90\%$ para $\mu$.


In [44]:
data = [1,2,3,4]
confidence = 0.90
gl = len(data) - 1
mean = np.mean(data)
error_est = st.sem(data)

# Intervalo para la media

IC = st.t.interval(confidence,gl,loc=mean,scale=error_est)
print("El intervalo del 90% de confianza para el peso medio de la poblacion es:", IC)

El intervalo del 90% de confianza para el peso medio de la poblacion es: (0.9809104349065063, 4.019089565093493)


  3. Encuentra un intervalo de confianza al nivel de $90\%$ para $\sigma^2$.

In [50]:
# Varianza muestral
s2 = np.var(data, ddof=1)  # ddof=1 para la varianza muestral

# Nivel de confianza
alpha = 1-confidence

# Valores críticos de chi-cuadrado
chi2_lower = st.chi2.ppf(1 - alpha / 2, n - 1)
chi2_upper = st.chi2.ppf(alpha / 2, n - 1)

# Calcular el intervalo de confianza para la varianza
conf_int = ( (n - 1) * s2 / chi2_lower, (n - 1) * s2 / chi2_upper)

print("Intervalo de confianza para sigma^2:", conf_int)

Intervalo de confianza para sigma^2: (0.6398175421974498, 14.210749829597598)
