# Метод наименьших квадратов. Ordinary Least Squares

Метод наименьших квадратов - математический метод, применяемый для решения различных задач, основанный на минимизации суммы квадратов отклонений некоторых функций от искомых переменных.
Задача заключается в нахождении коэффициентов линейной зависимости, при которых функция двух переменных $а$ и $b$

$F(a,b) = \sum_{i=1}^{n}\big(y_i - (ax_i + b)\big)^2$

принимает наименьшее значение. То есть, прямая с данными коэффициэнтами $а$ и $b$ у которой сумма квадратов отклонений экспериментальных данных от неё будет наименьшей. 

$y = a\cdot x +b$

## Вывод первый

Предположим $a$ известен и ищем сейчас $b$:

$$
\begin{array}{ll}
F(a,b) &= \sum _{i=1}^{n}\big(y_i - (ax_i + b)\big)^2 =\\
  &= \sum _{i=1}^{n}\big((y_i - ax_i) - b\big)^2\\
  &= \sum _{i=1}^{n}(y_i - ax_i)^2 -\sum _{i=1}^{n}2b(y_i - ax_i) +\sum _{i=1}^{n}b^2 =\\
  &= n b^2 - 2b * \sum _{i=1}^{n}(y_i - ax_i) + \sum _{i=1}^{n}(y_i - ax_i)^2
\end{array}
$$ 

Минимум достигается при 

$b = \frac{1}{n} \sum _{i=1}^{n}(y_i - ax_i) =\frac{1}{n} \sum _{i=1}^{n}y_i - \frac{a}{n}\sum _{i=1}^{n}x_i$

заменяем на:

$\overline{x} =  \frac{1}{n} \sum _{i=1}^{n}x_i$

$\overline{y} =  \frac{1}{n} \sum _{i=1}^{n}y_i$ 

подставляем в полученную формулу при минимуме:
$b = \overline{y} - a \overline{x}$

$$
\begin{array}{ll}
F(a,b) &= \sum _{i=1}^{n}\big(y_i - (ax_i + \overline{y} - a \overline{x})\big)^2 =\\
 &= \sum _{i=1}^{n}\big((y_i - \overline{y}) - (ax_i - a \overline{x})\big)^2 =\\
 &= \sum _{i=1}^{n}\big((y_i - \overline{y}) - a(x_i - \overline{x})\big)^2 =\\
 &= a^2\sum _{i=1}^{n}(x_i - \overline{x})^2 -2a\sum _{i=1}^{n}(x_i - \overline{x})(y_i - \overline{y}) + \sum _{i=1}^{n}(y_i - \overline{y})^2
\end{array}
$$ 

Квадратичная функция от $a$ достигает минимума при:

$a = {\displaystyle\frac{\sum _{i=1}^{n}(x_i - \overline{x})(y_i - \overline{y})}{\sum _{i=1}^{n}(y_i - \overline{y})}}$

$b =\overline{y} - \frac{\sum _{i=1}^{n}(x_i - \overline{x})(y_i - \overline{y})}{\sum _{i=1}^{n}(y_i - \overline{y})}\cdot\overline{x}$


## Вывод.

Составляется и решается система из двух уравнений с двумя неизвестными. Находим частные производные функции по переменным $a$ и $b$, приравниваем эти производные к нулю.

$
\left\{
\begin{array}{ll}
\frac{\partial F(a,b)}{\partial a} &=0\\
\frac{\partial F(a,b)}{\partial b} &=0\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
\frac{\partial \big(\sum _{i=1}^{n}(y_i - (ax_i + b))^2\big)}{\partial a} &=0\\
\frac{\partial \big(\sum _{i=1}^{n}(y_i - (ax_i + b))^2\big)}{\partial b} &=0\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
\Big(\sum _{i=1}^{n}(y_i - b -ax_i)^2\Big)_a' &=0\\
\Big(\sum _{i=1}^{n}(y_i - ax_i - b)^2\Big)_b' &=0\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
-2\sum _{i=1}^{n}(y_i - b -ax_i)\cdot x_i &=0\\
-2\sum _{i=1}^{n}(y_i - ax_i - b)&=0\\
\end{array}
\right.
$

Решаем полученную систему уравнений:

$
\left\{
\begin{array}{ll}
\sum _{i=1}^{n}(y_i - b -ax_i)\cdot x_i &=0\\
\sum _{i=1}^{n}(y_i - ax_i - b)&=0\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
\sum _{i=1}^{n}(y_i x_i - b x_i -ax_i x_i) &=0\\
\sum _{i=1}^{n}(y_i - ax_i - b)&=0\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
\sum _{i=1}^{n}y_i x_i - \sum _{i=1}^{n} b x_i - \sum _{i=1}^{n}ax_i^2 &=0\\
\sum _{i=1}^{n}y_i - \sum _{i=1}^{n} ax_i - \sum _{i=1}^{n} b&=0\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
\sum _{i=1}^{n}x_i y_i - \sum _{i=1}^{n} b x_i &= \sum _{i=1}^{n}ax_i^2\\
\sum _{i=1}^{n}y_i - \sum _{i=1}^{n} ax_i &= \sum _{i=1}^{n} b\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
\sum _{i=1}^{n}ax_i^2 &= \sum _{i=1}^{n}x_i y_i - \sum _{i=1}^{n} b x_i\\
\sum _{i=1}^{n} b &= \sum _{i=1}^{n}y_i - \sum _{i=1}^{n} ax_i\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
a \cdot\sum _{i=1}^{n}x_i^2 &= \sum _{i=1}^{n}x_i y_i - b \cdot \sum _{i=1}^{n}x_i\\
n \cdot b &= \sum _{i=1}^{n}y_i - a \cdot \sum _{i=1}^{n}x_i\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}x_i y_i - b \cdot \sum _{i=1}^{n}x_i}{\sum _{i=1}^{n}x_i^2}\\
b &= \frac{\sum _{i=1}^{n}y_i - a \cdot \sum _{i=1}^{n}x_i}{n}\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}x_i y_i - \frac{\sum _{i=1}^{n}y_i - a \cdot \sum _{i=1}^{n}x_i}{n} \cdot \sum _{i=1}^{n}x_i}{\sum _{i=1}^{n}x_i^2}\\
b &= \frac{\sum _{i=1}^{n}y_i - a \cdot \sum _{i=1}^{n}x_i}{n}\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}x_i y_i}{\sum _{i=1}^{n}x_i^2} - \frac{\sum _{i=1}^{n}y_i \cdot \sum _{i=1}^{n}x_i - a \cdot \sum _{i=1}^{n}x_i \cdot \sum _{i=1}^{n}x_i}{n\cdot\sum _{i=1}^{n}x_i^2}\\
b &= \frac{\sum _{i=1}^{n}y_i - a \cdot \sum _{i=1}^{n}x_i}{n}\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}x_i y_i}{\sum _{i=1}^{n}x_i^2} - \frac{\sum _{i=1}^{n}y_i \cdot \sum _{i=1}^{n}x_i}{n\cdot\sum _{i=1}^{n}x_i^2} + \frac{ a \cdot \sum _{i=1}^{n}x_i \cdot \sum _{i=1}^{n}x_i}{n\cdot\sum _{i=1}^{n}x_i^2}\\
b &= \frac{\sum _{i=1}^{n}y_i - a \cdot \sum _{i=1}^{n}x_i}{n}\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
a -\frac{ a \cdot (\sum _{i=1}^{n}x_i)^2}{n\cdot\sum _{i=1}^{n}x_i^2} &= \frac{\sum _{i=1}^{n}x_i y_i}{\sum _{i=1}^{n}x_i^2} - \frac{\sum _{i=1}^{n}y_i \cdot \sum _{i=1}^{n}x_i}{n\cdot\sum _{i=1}^{n}x_i^2}\\
b &= \frac{\sum _{i=1}^{n}y_i - a \cdot \sum _{i=1}^{n}x_i}{n}\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
a\cdot\big(1 -\frac{(\sum _{i=1}^{n}x_i)^2}{n\cdot\sum _{i=1}^{n}x_i^2}\big) &= \frac{n\cdot \sum _{i=1}^{n}x_i y_i - \sum _{i=1}^{n}y_i \cdot \sum _{i=1}^{n}x_i}{n\cdot\sum _{i=1}^{n}x_i^2}\\
b &= \frac{\sum _{i=1}^{n}y_i - a \cdot \sum _{i=1}^{n}x_i}{n}\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
a\cdot\frac{n\cdot\sum _{i=1}^{n}x_i^2 -  (\sum _{i=1}^{n}x_i)^2}{n\cdot\sum _{i=1}^{n}x_i^2} &= \frac{n\cdot \sum _{i=1}^{n}x_i y_i - \sum _{i=1}^{n}y_i \cdot \sum _{i=1}^{n}x_i}{n\cdot\sum _{i=1}^{n}x_i^2}\\
b &= \frac{\sum _{i=1}^{n}y_i - a \cdot \sum _{i=1}^{n}x_i}{n}\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
a &= \frac{n\cdot \sum _{i=1}^{n}x_i y_i - \sum _{i=1}^{n}y_i \cdot \sum _{i=1}^{n}x_i}{n\cdot\sum _{i=1}^{n}x_i^2} \cdot \frac{n\cdot\sum _{i=1}^{n}x_i^2}{n\cdot\sum _{i=1}^{n}x_i^2 -  (\sum _{i=1}^{n}x_i)^2}\\
b &= \frac{\sum _{i=1}^{n}y_i - a \cdot \sum _{i=1}^{n}x_i}{n}\\
\end{array}
\right.
$

Теперь начинаем переход в системе уравнений к средним $\overline{x} = \frac{\sum _{i=1}^{n}x_i}{n}$ и $\overline{y} = \frac{\sum _{i=1}^{n}y_i}{n}$ и чуть упрощаем с $n$:

$
\left\{
\begin{array}{ll}
a &= \frac{n\cdot \sum _{i=1}^{n}x_i y_i - \sum _{i=1}^{n}x_i \cdot \sum _{i=1}^{n}y_i} {n\cdot\sum _{i=1}^{n}x_i^2 -  (\sum _{i=1}^{n}x_i)^2}\\
b &= \frac{\sum _{i=1}^{n}y_i - a \cdot \sum _{i=1}^{n}x_i}{n}\\
\end{array}
\right.
\Leftrightarrow
\left\{
\begin{array}{ll}
a &= \frac{n}{n}\cdot\frac{\sum _{i=1}^{n}x_i y_i - \frac{\sum _{i=1}^{n}x_i \sum _{i=1}^{n}y_i}{n}} {\sum _{i=1}^{n}x_i^2 -  \frac{(\sum _{i=1}^{n}x_i)^2}{n}}\\
b &= \frac{\sum _{i=1}^{n}y_i}{n} - a \cdot \frac{\sum _{i=1}^{n}x_i}{n}\\
\end{array}
\Leftrightarrow
\right.
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}x_i y_i - \frac{\sum _{i=1}^{n}x_i \sum _{i=1}^{n}y_i}{n}} {\sum _{i=1}^{n}x_i^2 -  \frac{(\sum _{i=1}^{n}x_i)^2}{n}}\\
b &= \overline{y} - a \cdot \overline{x}\\
\end{array}
\Leftrightarrow
\right.
$

В числителе $a =$ + Прибавили - Убавили $\frac{\sum _{i=1}^{n}x_i \cdot \sum _{i=1}^{n}y_i}{n}$ и заменили подходящими средними $\overline{y} , \overline{x}$ сокращая с $n$. Так же в последнем слагаемом в числителе и знаменателе у $a$ ещё раз умножили и делили $\frac{n}{n}$: 

$
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}x_i y_i - \frac{\sum _{i=1}^{n}x_i}{n} \cdot \sum _{i=1}^{n}y_i - \frac{\sum _{i=1}^{n}x_i \sum _{i=1}^{n}y_i}{n} + \frac{\sum _{i=1}^{n}x_i \sum _{i=1}^{n}y_i}{n}} {\sum _{i=1}^{n}x_i^2 - \frac{n}{n} \cdot\frac{(\sum _{i=1}^{n}x_i)^2}{n}}\\
b &= \overline{y} - a \cdot \overline{x}\\
\end{array}
\Leftrightarrow
\right.
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}x_i y_i - \overline{x} \cdot \sum _{i=1}^{n}y_i - \sum _{i=1}^{n}x_i \cdot \frac{\sum _{i=1}^{n}y_i}{n} + \frac{n}{n}\cdot \frac{\sum _{i=1}^{n}x_i \sum _{i=1}^{n}y_i}{n}} {\sum _{i=1}^{n}x_i^2 - n\cdot \frac{(\sum _{i=1}^{n}x_i)^2}{n^2}}\\
b &= \overline{y} - a \cdot \overline{x}\\
\end{array}
\Leftrightarrow
\right.
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}x_i y_i - \overline{x} \cdot \sum _{i=1}^{n}y_i - \overline{y}\cdot \sum _{i=1}^{n}x_i + n\cdot \frac{\sum _{i=1}^{n}x_i}{n} \cdot \overline{y}} {\sum _{i=1}^{n}x_i^2 - n \cdot \big(\frac{\sum _{i=1}^{n}x_i}{n}\big)^2}\\
b &= \overline{y} - a \cdot \overline{x}\\
\end{array}
\Leftrightarrow
\right.
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}x_i y_i - \overline{x} \cdot \sum _{i=1}^{n}y_i - \overline{y}\cdot \sum _{i=1}^{n}x_i + n\cdot \overline{x}\cdot \overline{y}} {\sum _{i=1}^{n}x_i^2 - n \cdot (\overline{x})^2}\\
b &= \overline{y} - a \cdot \overline{x}\\
\end{array}
\Leftrightarrow
\right.
$

Сумма $n$ раз постоянного числа равна произведению его на $n$: $\sum _{i=1}^{n} A = (A + A + A + ... +A) = n \cdot A$:

$
n\cdot \overline{x}\cdot \overline{y} = (\overline{x}\cdot \overline{y} + \overline{x}\cdot \overline{y} + ... +\overline{x}\cdot \overline{y}) = \sum _{i=1}^{n} \overline{x}\cdot \overline{y}\\
n\cdot (\overline{x})^2 = ((\overline{x})^2 + (\overline{x})^2 + ... + (\overline{x})^2) =\sum _{i=1}^{n} (\overline{x})^2
$

И последний переход к средним $\overline{x}$, $\overline{y}$ с выносом сумм, скобок, ...:

$
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}x_i y_i - \overline{x} \cdot \sum _{i=1}^{n}y_i - \overline{y}\cdot \sum _{i=1}^{n}x_i + \sum _{i=1}^{n} \overline{x}\cdot \overline{y}} {\sum _{i=1}^{n}x_i^2 - n \cdot (\overline{x})^2 + n \cdot (\overline{x})^2 - n \cdot (\overline{x})^2}\\
b &= \overline{y} - a \cdot \overline{x}\\
\end{array}
\Leftrightarrow
\right.
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}(x_i y_i - \overline{x} \cdot y_i - \overline{y}\cdot x_i + \overline{x}\cdot \overline{y})} {\sum _{i=1}^{n}x_i^2 - 2n \cdot (\overline{x})^2 + n \cdot (\overline{x})^2}\\
b &= \overline{y} - a \cdot \overline{x}\\
\end{array}
\Leftrightarrow
\right.
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}\big(y_i (x_i - \overline{x}) - \overline{y}(x_i -\overline{x})\big)} {\sum _{i=1}^{n}x_i^2 - 2n \cdot \frac{\sum _{i=1}^{n}x_i}{n}\cdot \overline{x}  + n \cdot (\overline{x})^2}\\
b &= \overline{y} - a \cdot \overline{x}\\
\end{array}
\Leftrightarrow
\right.
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}(x_i - \overline{x})(y_i - \overline{y})}{\sum _{i=1}^{n}x_i^2 - 2\sum _{i=1}^{n}x_i\cdot \overline{x} + n \cdot (\overline{x})^2}\\
b &= \overline{y} - a \cdot \overline{x}\\
\end{array}
\Leftrightarrow
\right.
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}(x_i - \overline{x})(y_i - \overline{y})}{\sum _{i=1}^{n}x_i^2 - 2\overline{x}\cdot\sum _{i=1}^{n}x_i +  \sum _{i=1}^{n}(\overline{x})^2}\\
b &= \overline{y} - a \cdot \overline{x}\\
\end{array}
\Leftrightarrow
\right.
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}(x_i - \overline{x})(y_i - \overline{y})}{\sum _{i=1}^{n}(x_i^2 - 2\cdot x_i\cdot\overline{x} + (\overline{x})^2)}\\
b &= \overline{y} - a \cdot \overline{x}\\
\end{array}
\Leftrightarrow
\right.
$

Доехали:

$
\left\{
\begin{array}{ll}
a &= \frac{\sum _{i=1}^{n}(x_i - \overline{x})(y_i - \overline{y})}{\sum _{i=1}^{n}(x_i -\overline{x})^2}\\
b &= \overline{y} - a \cdot \overline{x}\\
\end{array}
\right.
$


In [1]:

500 320
550 380
620 400
630 390
665 385
700 410
770 480
880 600
920 570
1000 620

SyntaxError: invalid syntax (<ipython-input-1-96d786a89580>, line 2)