# Точкови оценки

Често в статистиката се търсят обобщаващи характеристики на дадена генерална съвкупност. В подобен вид задачи не търсим точните стойности на параметрите им, а оценката им, тъй като провежданите експерименти не дават абсолютно точни резултати.

## Постановка

Разглежда се определена генерална съвкупност $\Omega$. Нека $\overrightarrow{\theta} = (\theta_1,\ldots,\theta_k)$ е неизвестен фиксиран вектор, характеризиращ определен признак в $\Omega$. Дефинираме случайна величина $X$ в съвкупността $\Omega$, която по определен начин зависи от $\overrightarrow{\theta}$. Предполага се, че е получена извадка от $n$ елемента на $\Omega$, в които са наблюдавани стойностите $x_1, x_2, \ldots, x_n$ на $X$.

## Дефиниции

**Параметър** на разпределението на случайна величина е неизвестно число, което остава постоянно за тази случайна величина. Примери: математическо очакване, дисперсия, мода, медиана и квантил.

**Точкова оценка** $\theta^*$ на параметъра $\theta$ наричаме приближената му стойност, получена от извадката

Произволна функция $f(x_1, \ldots, x_n)$ се нарича **статистика на извадката** $(x_1, \ldots, x_n)$. Точковите оценки са параметри на генералната съвкупност.

Казваме, че оценката $\theta^*$ е **неизместена**, ако $E\Theta^*=\theta$. Разликата $E\Theta^* - \theta$ се нарича **изместване**.

- Ако $E\Theta^*=\theta+a$, където $a=\text{const}$, то оценката $\Theta^* - a$ е неизместена
- Ако $E\Theta^*=a\theta$, то оценката $\frac{1}{a}\Theta^*$ е неизместена

**Лема** (Сходимост по вероятност) Средното аритметично $\overline{x}$ е неизместена оценка на математическото очакване $E\xi$ на наблюдаваната случайна величина $\xi$.

Казваме, че оценката $\theta^*$ е състоятелна, ако за произволно $\epsilon \geq 0$ имаме $lim_{n \mapsto \infty}P(|\Theta^* - \theta| \leq \epsilon) = 1$.

Казваме, че дадена оценка за параметъра $\theta$ е **ефективна**, ако е с минимална дисперсия сред всички неизместени оценки на този параметър.

## Оценки с минимална дисперсия

**Теорема** Неизместената оценка с минимална дисперсия е единствена

### Неравенство на Рао-Крамер

Нека предположим, че наблюдаваната сл.в. притежава плътност.

**Определение** Наричаме функция на правдоподобие $f(x, \theta)$ плътността на наблюдаваната сл.в. $X$, когато тя зависи от неизвестен параметър

**Теорема** Нека $\theta$ е едномерен параметър и

1. $f(x, \theta) > 0,\quad x \in X$
2. $f(x, \theta)$ притежава производни по $\theta, \quad x \in X$
3. Съществува $E((\frac{d \log f}{d \theta}) ^ 2) < \infty$
4. $\hat{\theta}$ е неизместена оценка на $\theta$, такава че $E\hat{\theta^2} < \infty$

то е валидно следното неравенство:

$$D(\hat{\theta}) \geq \frac{1}{E((\frac{d\log f(x, \theta)}{d\theta})^2)}$$

## Намиране на точкови оценки

Точкови оценки за математическо очакване и дисперсия са разгледани по-горе. Нека разгледаме и по-общия въпрос: как да намерим точкови оценки на неизвестни параметри на разпределението на величината $X$. Нека неизвестните параметри на разпределението са $\theta_1,\ldots,\theta_k$.

### Метод на максималното правдоподобие (Maximum Likelihood)

Това е, може би, най-популярният метод за конструиране на точкови оценки. Неговата популярност се дължи на две неща:

1. Добра теоретична обосновка
2. Добри асимптотични качества на построените оценки.

Нека предположим, че разпределението в генералната съвкупност има плътност $f(x, \theta)$ известна с точност до неизвестен едномерен или многомерен параметър $\theta \in \Theta$. Тогава извадката ${x_1, \ldots, x_n}$ като вектор от независими сл.в. ще има плътност в извадъчното пространство $R^n$ от вида $L_n(\overrightarrow{x},\theta) = \Pi_{i=1}^nf(x_i, \theta)$, която наричаме функция на правдоподобие.

**Определение** Казваме, че оценката $\hat{\theta}(x)$ удовлетворява принципа на максимално правдоподобие, ако

$$L_n(\overrightarrow{x},\hat{\theta(x)}) = \max_{\theta}L_n(\overrightarrow{x}, \theta)$$

за почти всяко $x$ по мерките определени от плътностите $L_n(\overrightarrow{x}, \theta), \theta \in \Theta$.

Максимум на правдоподобието $L_n$ се достига в същата точка и за логаритъма $LL_n(\overrightarrow{x}, \theta) = \log L_n(\overrightarrow{x}, \theta)$. Удобно е при намирането му да решаваме "уравненията на правдоподобие":

$$\frac{d LL_n(\overrightarrow{x}, \theta)}{d\theta}=0.$$

**Определение** Наричаме оценката максимално-правдоподобна, ако функцията на правдоподобие е диференцируема и оценката удовлетрворява уравненията на правдоподобие.

### Метод на моментите

**Определение** n-ти момент на с.в. X се дефинира като средната ст-ст на $X^n$.

Този метод използва факта, че неизвестните параметри могат да се изразят чрез моментите на разпределението. Той се състои в следното:

- От извадката изчисляваме необходимите извадъчни моменти, които оценяват съответните моменти на разпределението на $X$.
- Търсените оценки на параметрите $\theta_1, \ldots, \theta_k$ се определят като се реши системата уравнения, отразяващи зависимостта между параметри и моментите на разпределението.