## Точечное оценивание

**Задача.** Пусть дана реализация выборки $x_1,\ldots,x_n$ из экспоненциального распределения $\operatorname{Exp}(\theta)$ с неизвестным параметром интенсивности $\theta>0$. Напомним, что плотность этого распределения имеет следущий вид:
$$
		f_{\theta}(u) =
		\begin{cases}
			\theta e^{-\theta u}, & u\ge0,\\
			0, & u<0.
		\end{cases}
$$
Оцените параметр $\theta$ по выборке в Python:

1) сгенерируйте $\theta$ из равномерного распределения на  $[1,5]$;  
2) сгенерируйте выборку из экспоненциального распределения $\operatorname{Exp}(\theta)$ размера  $n=10,100,1\,000,10\,000,100\,000$;   
3) найдите значение оценок $\theta$ с помощью метода моментов и метода максимального правдоподобия и с помощью метода fit() из SciPy;  
4) выведите отклонения полученных оценок от истинного значения параметра $\theta$. Что происходит с ростом $n$?

In [None]:
import numpy as np 
from scipy import stats 
import matplotlib.pyplot as plt

In [None]:
np.random.seed(1) 

In [None]:
# генерируем параметр lambda
theta = np.random.uniform(1,5)
print("Истинное значение параметра lambda: ", theta)

Обратите внимание на то, что в np.random.exponential параметр scale = 1/$\lambda$.

In [None]:
# генерируем выборки
sample1 = np.random.exponential(1/theta,size=10)
sample2 = np.random.exponential(1/theta,size=100)
sample3 = np.random.exponential(1/theta,size=1000)
sample4 = np.random.exponential(1/theta,size=10000)
sample5 = np.random.exponential(1/theta,size=100000)

In [None]:
# считаем оценки метода моментов и метода максимального правдоподобия (они совпадают)
e1 = 1/np.mean(sample1)
e2 = 1/np.mean(sample2)
e3 = 1/np.mean(sample3)
e4 = 1/np.mean(sample4)
e5 = 1/np.mean(sample5)

In [None]:
print("Значения оценок и их отклонения:")
print("n = 10, оценка = ", e1, ", отклонение от истинного значения = ", np.abs(e1-theta), sep="")
print("n = 100, оценка = ", e2, ", отклонение от истинного значения = ", np.abs(e2-theta), sep="")
print("n = 1000, оценка = ", e3, ", отклонение от истинного значения = ", np.abs(e3-theta), sep="")
print("n = 10000, оценка = ", e4, ", отклонение от истинного значения = ", np.abs(e4-theta), sep="")
print("n = 100000, оценка = ", e5, ", отклонение от истинного значения = ", np.abs(e5-theta), sep="")

Записать решение можно было бы значительно короче:

In [None]:
# обновим seed
np.random.seed(1) 

In [None]:
# генерируем выборки, записываем их в словарь
samples = { 10**i: np.random.exponential(1/theta,size=10**i) for i in range(1,6)}

In [None]:
# считаем оценки, выводим результаты
for n,sample in samples.items():
    e = 1/np.mean(sample)
    print("n = ",n,", оценка = ", e, ", отклонение от истинного значения = ", np.abs(e-theta), sep="")

Задачу мы решим с помощью метода **fit()** из **ScyPy**. Данный метод позволяет (численно) найти оценки максимального правдоподобия формы/сдвига/масштаба для классических распределений. 


Подробнее: https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.rv_continuous.fit.html

In [None]:
for n,sample in samples.items():
    e = 1/stats.expon.fit(sample, floc=0)[1]
    print("n = ",n,", оценка = ", e, ", отклонение от истинного значения = ", np.abs(e-theta), sep="")

Посмотрим визуально на то, как значение оценки сходится к истинному значению $\lambda$. Для хорошего графика пяти значений (как было выше) недостаточно, поэтому мы сделаем следующее: сгенерируем новую выборку размера $n=1\,000\,000$ и будем считать оценки по срезам этой выборки с шагом 5000 наблюдений.

In [None]:
# герерируем новую выборку 
sample = np.random.exponential(1/theta,size=10**6)

In [None]:
# в переменных x и y будем хранить размер выборки и значение оценки, посчитанной для этого размера выборки 
x,y = [],[]
for size in range(1000,10**6,5000):
    x.append(size)
    y.append(1/stats.expon.fit(sample[:size], floc=0)[1])    

In [None]:
# нарисуем график изменения оценки
# синяя линия — значение оценки, красная — истинное значение оценки

fig = plt.figure(figsize=(16,5)) 

plt.plot(x, y, color='blue'); 
plt.hlines(y=theta, xmin=1000, xmax=1000000, color='r', linestyles='dashed')

plt.show()