**Задача.** Пусть дана реализация выборки $x_1,\ldots,x_n$ из экспоненциального распределения $\operatorname{Exp}(\theta)$ с неизвестным параметром интенсивности $\theta>0$. Напомним, что плотность этого распределения имеет следущий вид:
$$
		f_{\theta}(u) =
		\begin{cases}
			\theta e^{-\theta u}, & u\ge0,\\
			0, & u<0.
		\end{cases}
$$
Постройте оценку максимального правдоподобия для $\theta$. Проверьте правильность полученной оценки в Python:

1) сгенерируйте $\theta$ из равномерного распределения на  $[1,5]$;  
2) сгенерируйте выборку из экспоненциального распределения $\operatorname{Exp}(\theta)$ размера  $n=10,100,1\,000,10\,000$;   
3) найдите значения полученных оценок;  
4) выведите отклонения полученных оценок от параметра $\theta$. Что происходит с ростом $n$?


In [10]:
import numpy as np
from scipy import stats

In [3]:
np.random.seed(100) 

Обратите внимание на то, что в np.random.exponential параметр scale = 1/$\lambda$.

In [26]:
theta = np.random.uniform(1,5)
print("Истинное значение параметра theta: ", theta)

Истинное значение параметра theta:  3.1736197671638617


In [27]:
sample1 = np.random.exponential(1/theta,size=10)
sample2 = np.random.exponential(1/theta,size=100)
sample3 = np.random.exponential(1/theta,size=1000)
sample4 = np.random.exponential(1/theta,size=10000)

In [28]:
e1 = 1/np.mean(sample1)
e2 = 1/np.mean(sample2)
e3 = 1/np.mean(sample3)
e4 = 1/np.mean(sample4)

In [29]:
print("Оценки метода максимального правдоподобия:")
print("1) n = 10, оценка = ", e1, ", отклонение от истинного значения = ", np.abs(e1-theta), sep="")
print("2) n = 100, оценка = ", e2, ", отклонение от истинного значения = ", np.abs(e2-theta), sep="")
print("3) n = 1000, оценка = ", e3, ", отклонение от истинного значения = ", np.abs(e3-theta), sep="")
print("4) n = 10000, оценка = ", e4, ", отклонение от истинного значения = ", np.abs(e4-theta), sep="")

Оценки метода максимального правдоподобия:
1) n = 10, оценка = 3.5431471209523857, отклонение от истинного значения = 0.36952735378852397
2) n = 100, оценка = 3.14285146376415, отклонение от истинного значения = 0.030768303399711705
3) n = 1000, оценка = 3.1397777947765144, отклонение от истинного значения = 0.03384197238734732
4) n = 10000, оценка = 3.176459277695443, отклонение от истинного значения = 0.0028395105315812685


Записать решение можно было бы значительно короче:

In [30]:
samples = { 10**i: np.random.exponential(1/theta,size=10**i) for i in range(1,8)}

In [31]:
for n,sample in samples.items():
    e = 1/np.mean(sample)
    print("n = ",n,", оценка = ", e, ", отклонение от истинного значения = ", np.abs(e-theta), sep="")

n = 10, оценка = 5.0674502631459415, отклонение от истинного значения = 1.8938304959820798
n = 100, оценка = 3.287897471747719, отклонение от истинного значения = 0.11427770458385744
n = 1000, оценка = 3.249273576231429, отклонение от истинного значения = 0.07565380906756713
n = 10000, оценка = 3.1580902357052563, отклонение от истинного значения = 0.015529531458605472
n = 100000, оценка = 3.179306112452666, отклонение от истинного значения = 0.005686345288804073
n = 1000000, оценка = 3.1743722124901903, отклонение от истинного значения = 0.0007524453263285658
n = 10000000, оценка = 3.172446676969214, отклонение от истинного значения = 0.0011730901946478411


____

Данную задачу можно было бы решить и с помощью метода **fit()** из **ScyPy**. С помощью данного метода можно (численно) найти оценки максимального правдоподобия формы/сдвига/масштаба для классических распределений. 


Подробнее: https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.rv_continuous.fit.html

In [1]:
from scipy import stats 

In [33]:
s1 = 1/stats.expon.fit(sample1, floc=0)[1]
s2 = 1/stats.expon.fit(sample2, floc=0)[1]
s3 = 1/stats.expon.fit(sample3, floc=0)[1]
s4 = 1/stats.expon.fit(sample4, floc=0)[1]

In [34]:
print("Оценки метода fit() из ScyPy:")
print("1) n = 10, оценка = ", s1, ", отклонение от истинного значения = ", np.abs(s1-theta), sep="")
print("2) n = 100, оценка = ", s2, ", отклонение от истинного значения = ", np.abs(s2-theta), sep="")
print("3) n = 1000, оценка = ", s3, ", отклонение от истинного значения = ", np.abs(s3-theta), sep="")
print("4) n = 10000, оценка = ", s4, ", отклонение от истинного значения = ", np.abs(s4-theta), sep="")

Оценки метода fit() из ScyPy:
1) n = 10, оценка = 3.5431471209523857, отклонение от истинного значения = 0.36952735378852397
2) n = 100, оценка = 3.14285146376415, отклонение от истинного значения = 0.030768303399711705
3) n = 1000, оценка = 3.1397777947765144, отклонение от истинного значения = 0.03384197238734732
4) n = 10000, оценка = 3.176459277695443, отклонение от истинного значения = 0.0028395105315812685


In [11]:
stats.norm.cdf(1.7) - stats.norm.cdf(-1.7)

0.910869074482914