**Упражнение 3.** Пусть дана реализация выборки $x_1,\ldots,х_n$ из равномерного распределения на отрезке $[0,\theta]$. Найдите оценку для неизвестного параметра $\theta$ методом моментов и методом максимального правдоподобия. Исследуйте полученные оценки на несмещенность и состоятельность.

In [3]:
import numpy as np
np.random.seed(11)

In [9]:
#Сгенерируем theta из равномерного распределения на отрезке [25, 50]
theta = np.random.uniform(25,50)
theta

37.135677454194564

In [11]:
#Сгенерируем выборки из равномерного распределения [0, theta] размером n = 10, 100, 1000, 10000
list_sample = []
for n in [10, 100, 1000, 10000]:
    list_sample.append(np.random.uniform(0, theta, size=n))
# list_sample

In [12]:
#Найдем значения оценок
estimate_mme_list = []
estimate_mle_list = []
for sample in list_sample:
    estimate_mme_list.append(2*np.mean(sample)) #оценки theta методом моментов
    estimate_mle_list.append(np.max(sample)) #оценки theta методом максимального правдоподобия

print(estimate_mme_list)
print(estimate_mle_list)

[34.94051421332823, 34.521881591128746, 36.827150408518236, 37.171709073182065]
[27.856974319597718, 37.13551664367709, 37.11848749226746, 37.133900780799465]


In [18]:
#оценим несмещенность оценок
print('Действительное значение параметра:', theta)
print('Среднее арифметическое оценок метода моментов:', np.mean(estimate_mme_list))
print('Среднее арифметическое оценок метода макс. правдоподобия:', np.mean(estimate_mle_list))

Действительное значение параметра: 37.135677454194564
Среднее арифметическое оценок метода моментов: 35.86531382153932
Среднее арифметическое оценок метода макс. правдоподобия: 34.81121980908543


Как видно, усрерднение оценок даже в случае с 4 выборками позволяет получить значение, относительно близкое к действительному значению параметра, хотя 4 выборки - это слишком мало, чтобы судить о несмещенности с какой-то достоверностью

In [22]:
#оценим состоятельность оценок
sample_size = 10
print('Отклонения оценок, полученных методом моментов')
for est in estimate_mme_list:
    print('Для выборки размера n=', sample_size, 'отколение составило:', est-theta)
    sample_size *= 10

print()
sample_size = 10
print('Отклонения оценок, полученных методом максимального правдоподобия')
for est in estimate_mle_list:
    print('Для выборки размера n=', sample_size, 'отколение составило:', est-theta)
    sample_size *= 10

Отклонения оценок, полученных методом моментов
Для выборки размера n= 10 отколение составило: -2.1951632408663357
Для выборки размера n= 100 отколение составило: -2.6137958630658176
Для выборки размера n= 1000 отколение составило: -0.30852704567632827
Для выборки размера n= 10000 отколение составило: 0.036031618987500735

Отклонения оценок, полученных методом максимального правдоподобия
Для выборки размера n= 10 отколение составило: -9.278703134596846
Для выборки размера n= 100 отколение составило: -0.00016081051747107722
Для выборки размера n= 1000 отколение составило: -0.01718996192710165
Для выборки размера n= 10000 отколение составило: -0.0017766733950992375


Как видно, с увеличением размера выборки, отклонение оценки параметра от его истинного значения имеет тенденцию к уменьшению

**Упражнение 5.** Пусть дана реализация выборки $x_1,\ldots,x_n$ из нормального распределения $N(\theta_1,\theta_2^2)$. Найдите оценки для неизвестных параметров $\theta_1$ и $\theta_2^2$ методом моментов и методом максимального правдоподобия. Являются ли оценки $\theta_1$ несмещенными и состоятельными? Являются ли оценки $\theta_2^2$ несмещенными? Сделайте какое-то предположение о состоятельности оценок на $\theta_2^2$.

In [51]:
#Сгенерируем theta_1 из равномерного распределения на [-5, 5], (theta_2)^2 из равномерного распределения на [0.5, 10]
theta_1 = np.random.uniform(-5,5)
theta_2_sq = np.random.uniform(0.5,10)
theta_2 = theta_2_sq**0.5

In [52]:
#Сгенерируем выборку из нормального распределения N(theta_1, (theta_2)^2) размера n = 10, 100, 1000, 10000
list_sample_n = []
for n in [10, 100, 1000, 10000]:
    list_sample_n.append(np.random.normal(theta_1, theta_2, size=n))
# list_sample_n

In [55]:
#Найдем значения оценок
#Вспомним, что параметры нормального распределения - это и есть математическое ожидание и дисперсия.
#Соответственно, их оценки по методу моментов - это и есть эмпирические оценки математического ожидания и дисперсии.
#Заметим также, что в данном случае оценки, получаемые методом моментов и методом максимального
#правдоподобия совпадают.
theta_1_est_list = []
theta_2_sq_est_list = []
for sample in list_sample_n:
    #оценки theta_1 методом моментов/методом максимального правдоподобия
    theta_1_est_list.append(np.mean(sample))
    #оценки (theta_2)^2 методом моментов/методом максимального правдоподобия
    theta_2_sq_est_list.append(np.mean((sample - np.mean(sample))**2))

print(theta_1, theta_2_sq)    
print(theta_1_mme_list)
print(theta_2_sq_mme_list)

2.0084429569439424 9.92147740548029
[3.0728177520609434, 1.9180775392072353, 2.1382688047418785, 2.010944898914992]
[9.257437869714384, 8.198652700414447, 9.74964392691373, 10.049609462906883]


In [56]:
#оценим несмещенность оценок
print('Действительное значение параметра theta_1:', theta_1)
print('Среднее арифметическое оценок theta_1:', np.mean(theta_1_est_list))
print()
print('Действительное значение параметра (theta_2)^2:', theta_2_sq)
print('Среднее арифметическое оценок (theta_2)^2:', np.mean(theta_2_sq_est_list))

Действительное значение параметра theta_1: 2.0084429569439424
Среднее арифметическое оценок theta_1: 2.285027248731262

Действительное значение параметра (theta_2)^2: 9.92147740548029
Среднее арифметическое оценок (theta_2)^2: 9.059214760275164


Как видно, в обоих случаях среднее арифметическое оценок оказалось достатончо близким к значению истинного параметра. Вместе с тем известно, что оценка $\theta_1$ является несмещенной в силу свойств математического ожидания. А вот оценка $\theta_2^2$ является смещенной, и чтобы избавиться от смещения нужно сумму квадратов отклонений значений выборки от арифметического среднего значений выборки делить не на n, а на (n-1).

In [57]:
#оценим состоятельность оценок
sample_size = 10
print('Отклонения оценок theta_1')
for est in theta_1_est_list:
    print('Для выборки размера n=', sample_size, 'отколение составило:', est-theta_1)
    sample_size *= 10

print()
sample_size = 10
print('Отклонения оценок (theta_2)^2')
for est in theta_2_sq_est_list:
    print('Для выборки размера n=', sample_size, 'отколение составило:', est-theta_2_sq)
    sample_size *= 10

Отклонения оценок theta_1
Для выборки размера n= 10 отколение составило: 1.064374795117001
Для выборки размера n= 100 отколение составило: -0.09036541773670703
Для выборки размера n= 1000 отколение составило: 0.12982584779793616
Для выборки размера n= 10000 отколение составило: 0.0025019419710496926

Отклонения оценок (theta_2)^2
Для выборки размера n= 10 отколение составило: -1.589783322737345
Для выборки размера n= 100 отколение составило: -1.804811232069989
Для выборки размера n= 1000 отколение составило: -0.18158312249347297
Для выборки размера n= 10000 отколение составило: 0.12712709648030263


Как видно, в целом, с увеличением размеров выборки значение оценки оказывается все ближе к истинному значению параметра. Оценки $\theta_1$ и $\theta_2^2$ являются состоятельными.

**Упражнение 6.** В Python найдите с помощью метода Монте-Карло площадь заштрихованной желтым фигуры (см. рисунок в файле с домашним заданием). Сколько случайных точек надо бросить в этот квадрат, чтобы получить значение площади с точностью 0.01 и с вероятностью примерно равной 0.997?

In [69]:
#Считаем, сколько нужно сгенерировать точек
n = int(4*2/(0.005)**2)
n

320000

In [70]:
#Cгенерируем выборку
sample = np.random.rand(n,2)

In [71]:
#Проверяем, какие точки попали в нашу фигуру (имеется в виду четверть)
points_in_fig = [sample[i,1] <= sample[i,0]**2 for i in range(n)]

In [72]:
#Оцениваем нашу площадь (всей фигуры, а не ее четверти)
s = 4*np.mean(points_in_fig)

In [73]:
print('Истинное значение площади:', 4/3)
print('Наша оценка площади:', s)

Истинное значение площади: 1.3333333333333333
Наша оценка площади: 1.33365
